检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
效时段。 图8 设置生效时间 当所有SLA信息都填好后,单击“提交”,即可成功创建自定义SLA。 1、仅自定义SLA支持创建,公共SLA会自动预置在系统里,仅对租户开启“启用”,“禁用”,“查看”功能。 2、创建或修改SLA后,将对新进入SLA流程的工单开始生效,对已处于SLA流程中的工单不会生效。
目标实例 在筛选框设置条件,手动选择或自动全选筛选出的实例。 - 设置“分批策略”、“熔断策略”和“是否关机”。 分批策略:可选项为“自动分批”、“手动分批”、“不分批”,只可选择其中一项。 自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自
目标实例 在筛选框设置条件,手动选择或自动全选筛选出的实例。 - 设置“分批策略”、“熔断策略”和“是否关机”。 分批策略:可选项为“自动分批”、“手动分批”、“不分批”,只可选择其中一项。 自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自
脚本或者作业的功能。 核心优势 动态识别:OS合规性风险动态识别。 资源自动发现和纳管。 安全生产:执行运维操作时,自动分批、爆炸半径评估等。 自动预警:短信、邮件、企业微信等自动通知。 前提条件 执行自动化运维的主机需安装UniAgent。 创建补丁基线 通过Cloud Operations
当前告警”页签列表中,对要处理的告警进行清除、转事件、处理、查看历史记录操作。 图11 汇聚告警列表 在告警自动处理页面,可选择已有的脚本、作业,并选择目标实例进行自动化处理。 图12 告警自动处理 单击“转事件”,填写应用、事件级别、责任人等字段,单击“提交”,即可进行告警转事件。并会根据通知规则对责任人进行通知。
当前告警页签清除,清除后的汇聚告警可以在历史告警页签中查看。 注意事项 只有责任人可以将当前告警进行清除。 告警数据留存期为31天,逾期将自动清除,包含历史告警页签的数据。 操作步骤 登录云运维中心。 在左侧导航栏选择“故障管理 >告警管理”。 单击“汇聚告警 > 当前告警”。
通过流转规则可以将一条或多条原始告警汇聚成单条汇聚告警,一条原始告警可以触发多个流转规则。 注意事项 页面默认显示31天的告警信息,过期的告警将自动清除。 操作步骤 登录云运维中心。 在左侧导航栏选择“故障管理 >告警管理”。 在“原始告警”页签,单击告警名称。 查看原始告警详情。 父主题:
在筛选框设置条件,选择筛选出的实例。 - 设置“分批策略”、“熔断策略”和“是否关机”。 分批策略:可选项为“自动分批”、“手动分批”、“不分批”,只可选择其中一项。 自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。
进入COC“总览”后,可以查看安全云脑的安全评分。 图1 安全评分 单击“前往处理”,可跳转至安全云脑。 图2 跳转安全云脑 若您是通过创建IAM3.0委托,切换角色的方式访问COC总览页的安全评分模块,且委托授权时选择了COC策略授权范围为“全局服务资源”,请为该委托补充添加“SecMaster
风险评估:基于场景规则、流程规则、业务规则对变更进行管控,提前识别和拦截变更风险;通过变更日历实现变更冲突检测,降低服务间变更依赖导致的变更风险。 实施保障:按预定方案执行变更,变更步骤标准化、可观测,变更异常及时介入处理,实现变更实施全过程可控、可视、可管。 确定性故障管理
账号集中运维能力。 图2 资源全生命周期管理 变更风控&作业可信 融合华为SRE安全生产最佳实践的管控模型,助力客户作业可信和稳定可靠。 全方位作业可信:构筑人员风险评估、高危命令拦截和自动化稽查能力,从事前、事中、事后逐层拦截变更风险,实现全方位运维作业可信。 AI加持风险评估
账号,且为组织(organizations云服务中设置)中的管理员或者COC云服务的委托管理员时,你可以对组织内其它账号下的资源进行统一的自动化运维操作,避免多账号操作导致的人力浪费,也降低了人工操作导致的遗漏等风险。 视图是一组筛选器,用户可以自由配置筛选范围,用于在跨账号场景下访问华为云中的资源信息。
故障复盘 操作场景 事件验证通过后,会根据故障复盘规则自动生成故障报告,在故障报告基础上对本次故障进行复盘,避免故障再次发生。故障复盘信息包含有故障现象、故障影响、故障处理过程、根因分析、解决方案,同类故障、改进措施等15种以上分析项。 系统默认P1/P2/P3/P4级别的事件和
故障复盘 操作场景 事件验证通过后,会根据故障复盘规则自动生成故障报告。如果当前故障复盘规则不符合实际业务,可以参考如下操作调整故障复盘规则。 开启/关闭规则 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”。 单击“事件流程 > 故障复盘”。 单击是否开启列按钮。 完成故障复盘规则开启或关闭。
为了请求B账号下的数据资产信息,COC会自动在B账号中创建服务关联委托: 该委托是云服务委托,“委托权限”为“COCAssumeServiceLinkedAgencyPolicy”,“委托名称”为“ServiceLinkedAgencyForCOC”。 删除B账号时,COC会自动删除B账号内的服务关联委托。
可选项“应急预案”、“脚本”、“作业”。 自动执行 勾选是否自动执行。自动化预案、脚本、作业支持自动执行。 勾选“自动执行”后,显示“参数映射”,系统根据上方的触发条件及设置自动执行。 参数值、Region ID、和目标实例填写格式为${},需要通过该表达式解析对应的值,详细请参考自动化执行参数示例说明。
可选项“需要”、“不需要”。 需要:工单走到待现网实施阶段,需要关联变更单。 不需要:工单会走到待验证状态。 单击“提交”。 完成问题单定位出方案,若是否需要现网变更选择“需要”,问题单状态为“待现网实施”,若是否需要现网变更选择“不需要”,问题单状态为“待验证”。 父主题: 问题管理
资源监控 登录云运维中心。 进入COC“总览”后,可以查看CES监控的指标信息。 图1 CES监控信息 在云服务选择组件处可切换需要查看的云服务类型。 图2 切换云服务类型 单击“编辑指标”可自定义配置展示的监控指标。 图3 编辑指标 单击右上角的“更多”,跳转到CES主机监控界面,查看原始信息。
0到1构建运维驾驶舱。 运维总览 资源总览 运维沙盘 人员与排班 人员管理 排班管理 资源管理与运维 资源管理 应用管理 补丁扫描与修复 自动化运维 脚本管理 作业模板与执行 定时运维 故障管理 配置和应用流转规则 标准化事件管理流程 集成告警 WarRoom机制 可用性分析 混沌演练
批量操作常见问题 批量ECS资源切换镜像报错如何处理? 父主题: 资源运维常见问题