已找到以下 290 条记录
AI智能搜索
产品选择
云运维中心 COC
没有找到结果,请重新输入
产品选择
云运维中心 COC
在搜索结果页开启AI智能搜索
开启
产品选择
没有找到结果,请重新输入
  • 概述 - 云运维中心 COC

    通过提前制定快速恢复应急预案进行应对。 COC混沌演练为用户提供一站式的自动化演练能力,覆盖从风险识别、应急预案管理、故障注入到复盘改进的端到端演练流程。承载华为云SRE在混沌演练上多年的最佳实践,使客户能对云上应用主动地进行风险识别、消减和风险验证,持续提升云应用的韧性。 镜像与武器版本支持声明

  • 概述 - 云运维中心 COC

    概述 云运维中心支持脚本管理功能。您可以通过执行脚本,完成复杂或重复的自动化任务。脚本管理可以对脚本进行高危检测,也支持Windows和Linux操作系统,当前脚本支持弹性云服务器 ECS、裸金属服务器 BMS、Flexus应用服务器L实例三种云资源。 自定义脚本 自定义脚本是由

  • 管理定时任务 - 云运维中心 COC

    管理定时任务 操作场景 您可以对定时运维任务进行审批、启用/禁用、编辑、删除等操作。 审批:若企业管理员在定时运维场景配置了入库人工审核,则需要审批人审批后,定时运维任务才能执行启用/禁用/编辑操作。 启用/禁用:禁用状态下的定时运维任务不生效,禁用状态才能启用,启用状态下才能禁用。

  • 开始评估 - 云运维中心 COC

    开始评估 操作场景 当您需要对应用韧性评估任务进行评估时,请按如下操作进行。 若评估状态为“未评估”,详细操作请参考开始评估。 若评估状态为其他状态,详细操作请参考重新评估。 注意事项 一个应用当前支持最多评估30次,若评估达到上限,再次”重新评估”时,会提示自动删除最老的评估报告,需要用户确认后,才能开启新的评估。

  • 应急预案 - 云运维中心 COC

    应急预案 操作场景 您可以对系统可能发生的故障建立对应的应急预案,在故障发生后可以参考应急预案进行故障紧急恢复。 创建应急预案 登录COC。 在左侧菜单栏选择“韧性中心 > 应急预案”页面,选择“自定义预案”页签。 图1 应急预案页面 单击“创建应急预案”,填写应急预案基本信息。

  • 常规变更&紧急变更的区别? - 云运维中心 COC

    紧急变更(为了处理生产环境不可用或机器不可用、紧急满足业务需求而提出的计划外变更,无法满足计划性要求,或者来不及走正常流程进行评估审批的变更)。 审批环节上的区别 支持针对常规变更、紧急变更两个场景配置审批环节。 父主题: 变更管理常见问题

  • 执行自定义脚本 - 云运维中心 COC

    自定义脚本配置完成后,若需要执行自定义脚本,请按如下操作进行。 注意事项 在执行脚本时需要确认是否有目标机所属组件资源权限。 执行自定义脚本 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”,进入“自动化运维”页面。 在“日常运维”模块单击“脚本管理”,进入“脚本管理”页面。 在“自定义脚本”页

  • 故障模式和演练任务的关系? - 云运维中心 COC

    故障模式和演练任务的关系? 故障模式是对云应用进行评估,识别风险,是混沌演练的前提,演练任务将不同的攻击场景组合起来,使用故障注入来模拟对应的故障模式。 父主题: 韧性中心常见问题

  • 集成管理 - 云运维中心 COC

    启用、禁用集成操作步骤 登录COC。 在左侧导航栏选择“故障管理 > 集成管理”,进入“集成管理”页面。 在集成管理配置页面单击接入源上的“启用/禁用”可以对接入源进行启用或者禁用操作。也可以单击接入源,进入接入源详情后,单击底部的“启用”、“禁用”按钮进行启用或者禁用操作。 更新集成标识操作步骤 登录COC。

  • API概览 - 云运维中心 COC

    接口分类 说明 应用资源管理 包括租户委托首次同步租户RMS资源、查询租户的资源信息等 自动化运维 包括自定义脚本的创建、修改、删除、查询等 事件管理 包括事件的创建、处理、验证及查询 集成管理 主要为用户上报自监控系统的告警至COC 补丁管理 包括补丁管理合规性报告查询相关接口

  • 补丁基线 - 云运维中心 COC

    登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”,进入“自动化运维”页面。 在“日常运维”模块单击“补丁管理”,进入“补丁管理”页面。 选择“补丁基线”页签,查看基线列表。 选择需要删除的基线,单击“删除”,完成补丁基线删除。 父主题: 补丁管理

  • 故障模式是什么? - 云运维中心 COC

    故障模式是什么? 故障模式是对云应用面临的潜在风险进行分析和评估的结果,混沌演练平台预置华为云多年积累的故障模式数据,使用FT-FMEA故障分析法帮助您分析云应用存在的潜在风险。 父主题: 韧性中心常见问题

  • 改进管理 - 云运维中心 COC

    改进管理 改进管理主要是故障处理过程识别到一些改进事项可通过改进单进行跟踪闭环。改进来源包含事件/Warrroom/演练/PRR。 改进管理 父主题: 故障管理

  • 排班管理概述 - 云运维中心 COC

    排班管理概述 排班管理为云运维中心提供了统一的、多维度、多形式、可自定义的人员管理模式。您可以在排班管理对排班场景进行管理,并将“人员管理”中的人员添加到排班中完成排班的设置。 在需要设置排班人员、获取排班人员时,您直接前往排班管理页面进行配置、查询。 已创建的排班可直接在流转规

  • 集成管理 - 云运维中心 COC

    集成管理 集成配置支持简单、快速集成现有或第三方等监控系统;将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 监控系统接入后,配置流转规则后可将告警信息转事件或告警。 集成管理 父主题: 故障管理

  • 事件管理 - 云运维中心 COC

    事件管理 事件管理主要是对应用的所有事件进行管理,包含事件的受理、驳回、转单、处理到闭环整个生命周期管理。事件来源包含流转规则产生的事件、通过告警创建的事件及人工创建的事件。 事件管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。 事件流程 创建事件 处理事件 事件历史记录

  • 问题管理 - 云运维中心 COC

    问题管理 问题管理主要是对应用的所有问题单进行管理,通过识别故障的实际和潜在原因、管理规避方案和已知错误,来降低故障再次发生的可能性和影响性。包含问题单的创建、受理、驳回、转单、处理到闭环整个生命周期管理。问题单来源主要有人工创建与北向接口创建。 问题管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。

  • 受理问题 - 云运维中心 COC

    受理问题 登录COC。 在左侧菜单栏选择“故障管理 > 问题管理”,进入“待我处理”的问题列表页面。 点击问题单名称进入问题详情页面,单击右上角“受理”,受理后可对问题单进行分析定位。 父主题: 处理问题

  • 资源运维权限和授权项说明 - 云运维中心 COC

    策略包含系统策略和自定义策略,如果系统策略不满足授权要求,管理员可以创建自定义策略,并通过给用户组授予自定义策略来进行精细的访问控制。策略支持的操作与API相对应,授权项列表说明如下: 权限:允许或拒绝对指定资源在特定条件下进行某项操作。 对应API接口:自定义策略实际调用的API接口。

  • 查看告警 - 云运维中心 COC

    操作步骤 登录COC。 在左侧菜单栏单击“故障管理 > 告警管理”,可以查看汇聚告警或原始告警列表信息。 在汇聚告警搜索框中输入告警单号、集成告警名称,“回车”进行搜索。 汇聚告警包含当前告警和历史告警。 图1 告警列表 父主题: 告警管理