检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
某电商企业的新应用已经部署生产环境,计划正式启动接入和引流,其传统运维模式日常运维工作以被动救火为主,缺乏主动运维理念和工具能力;应用上线前无有效途径识别可用性问题,上线后可用性现状无法精确掌握,运维团队缺少故障应急能力和实战经验;希望通过混沌演练对应用在生产环境的架构韧性进行一次引流前的“排雷”和“验收”,以确保在正式引流时无重大稳定性风险。
概述 定时运维页面展示所有定时任务详情和执行记录。您可以在这里创建定时任务,也可以管理已创建的定时任务。创建定时任务后,系统按确定时间或周期定时触发脚本执行、作业管理等操作。 定时运维包含如下几项核心要素: 定时设置:单次执行,周期执行(设置简单周期或Cron表达式)。 任务类型:脚本,作业。
风险等级:LOW;HIGH;MEDIUM;审批人只支持修改 script_params 否 Array of ScriptParamDefine objects 脚本入参 数组长度:0 - 5 表3 ScriptPropertiesModel 参数 是否必选 参数类型 描述 risk_level 是 String
最小长度:1 最大长度:4096 script_params 否 Array of ScriptParamDefine objects 脚本入参 数组长度:0 - 20 表2 ScriptPropertiesModel 参数 是否必选 参数类型 描述 risk_level 是 String
单击“提交”。 图11 单击提交后执行界面 确认执行信息,若无误则单击“确定”。 扫描工单执行完成后,单击“合规性报告”按钮则可跳转到合规性报告界面,查看ECS实例合规性状态。 图12 扫描工单界面 图13 合规性报告界面 查看补丁合规性报告 补丁合规性扫描或修复后,用户可单击合规性报告详情摘要查看实例上的补丁详情。
通知模板解释 事件通知模板:不同模板对应不同场景,在事件单进入某个场景下或者经过了某个场景后,可以进行发送通知,解释如下: 事件创建:创建事件后需要发送通知。 事件驳回:事件被驳回后发送通知。 事件转发:事件转发后发送通知。 事件验证:事件解决后进入待验证状态时发送通知。 事件完成:事件已经处理并验证通过后发送通知。
2、您可以通过coc界面action的编辑按钮来控制相应功能是否开启管控,注意所有操作请在coc完成,切勿直接操作策略。 3、工单提权开启后,策略绑定了用户后,若需要关闭工单提权,需先将用户组中的策略解绑后才能关闭。 4、工单提权时校验操作的资源region、应用和工单状态,若操作的资源无所属region、应用
单击“接入集成”进入新增集成页面。 图1 接入集成 在新增集成页面有对集成的介绍和集成接入步骤,根据步骤进行集成,集成完成后单击底部“确认集成”。 确认集成后,在集成管理页面“已集成”部分,接入源状态会变为“已启用”。 该步骤主要自定义监控系统接入步骤 登录COC。 在左侧导航栏选择“故障管理
单击“转发”按钮 填写转发信息后,单击“提交”。 图18 填写转发信息 单击“升降级”。 图19 单击“升降级”按钮 填写升降级信息后,单击“提交”。 图20 填写升降级信息 单击“启动warroom”。 图21 单击“启动warroom”按钮 填写warroom信息后,单击“提交”。 图22
员。 管理员可以添加或者取消成员的委托管理员权限,组织成员架构变动时需要1-2分钟后刷新页面才能生效。 由组织管理员或委托管理员邀请B账号加入组织,相关操作请参见邀请账号加入组织。 B账号加入组织后,登录A账号在COC服务“运维态势感知”、”资源管理”、”作业管理”页面可对B账号进行跨账号运维管理。
点击问题单名称进入问题详情页面,单击右上角“现网实施”,跳转现网实施页面,系统会默认带出涉及的区域,填写区域对应的变更单后,系统会获取变更结果;若部分区域不涉及变更,可点击操作列的“不涉及变更”。 填写完变更信息后,单击右下角的“实施完成”,会走到待验证阶段。 图1 问题关联变更单 父主题: 处理问题
您可以根据自身需要,按场景完成各项配置任务,配置完成后,即可在云运维中心对应场景中进行相关运维操作。 云服务配置:提供云监控服务(CES)的多区域告警规则一次性配置能力。 云运维中心配置 登录云运维中心。 进入COC“总览”后,可以看到快速配置中心。 图1 快速配置中心 如果“总
说明 应用名称 test-application 根据命名规则,自定义应用的名称。填写后单击“保存”,进入新建组件页面。 组件名称 test-component 根据命名规则,自定义组件的名称。填写后单击“保存”,进入新建分组页面。 分组名称 test-group 根据命名规则,自定义分组的名称。
在左侧导航栏选择“基础配置 > 排班管理”页面,选择排班场景,单击“清空人员”。 图2 全局轮班场景删除人员 在清空人员弹窗填写开始时间和结束时间,选择排班角色后,单击“确定”,即可清空排班。 图3 全局轮班场景清空人员 应用排班+固定班次 登录COC。 在左侧导航栏选择“基础配置 > 排班管理”页面
与会成员 PRR评审会议的与会成员 会议纪要人 PRR评审会议的会议纪要人 填写完PRR评审的检查项信息后,可以选择上传自检材料,单击 “添加自检材料”,进行自检材料上传。 填写完成后单击“确认”。 图4 发起PRR评审完成 查看PRR评审详情 登录COC。 在左侧菜单栏选择“韧性中心
事件管理”,选择“待处理的”页签,单击事件标题进入“事件详情”页面。 图1 进入事件详情 单击“转发责任人”。 图2 转发责任人 填写转发信息后,单击“提交”。 图3 填写转发信息 父主题: 处理事件
在左侧菜单栏选择“故障管理 > 问题管理”,进入“待我处理”的问题列表页面。 点击问题单名称进入问题详情页面,单击右上角“驳回”,创单人可对问题单重编辑后提交或撤回关闭。 图1 问题单驳回 父主题: 处理问题
班场景名称后面会显示“全局排班+轮班(周一 -- 周日)”),单击“添加人员”添加排班人员。 图2 全局轮班场景添加排班人员 填写添加信息后,单击“确定”。 图3 添加人员 开始时间:选择日期,重新排班策略将从该日期的00:00分开始 结束时间:选择日期,重新排班策略将从该日期的23:59分结束
提供大量检查项能力和优化建议,例如ECS实例规格检查,资源实例或集群是否开启自动备份等。 优化顾问 登录云运维中心。 进入COC“总览”后,可以查看优化顾问信息。 单击“查看风险项”可查看TOP10风险项清单。 图1 查看风险项 单击“去优化”跳转优化顾问。 图2 跳转优化顾问
通过云运维中心查看安全云脑 SecMaster的安全监控信息,安全评分维度包含合规检查、漏洞、威胁告警等。 安全概览 登录云运维中心。 进入COC“总览”后,可以查看安全云脑的安全评分。 图1 安全评分 单击“前往处理”,可跳转至安全云脑。 图2 跳转安全云脑 父主题: 总览