检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
需安装UniAgent主机的详细信息,必选项。 填写如下信息: 主机IP:主机的IP。 操作系统:主机的操作系统,Linux或Windows。 登录帐号:登录主机的帐号。当操作系统为Linux时,建议使用root帐号,可保证有足够的读写权限。 登录端口:访问主机的端口。 认证方式:认证方式为密码。
提供用户删除IDC离线资源的能力。 操作场景 通过Cloud Operations Center删除线下IDC离线资源。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理 > 应用资源管理”,进入“资源管理”页面,选择“IDC”页签,单击“操作”列中的“删除”。 图1 删除IDC离线资源
提供用户编辑IDC离线资源的能力。 操作场景 通过Cloud Operations Center编辑线下IDC离线资源。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理 > 应用资源管理”,进入“资源管理”页面,选择“IDC”页签,单击“操作”列中的“编辑”。 图1 编辑IDC离线资源
图2 excel录入信息 单击“添加文件”,添加录入信息后的表格。 录入完成后,单击左上角返回到“资源管理”页签,即可查看录入的IDC离线资源信息。 图3 IDC离线资源 父主题: 多云配置
选择区域,应用,事件级别,加入群组信息,完成后,单击“确定”。 起会规则命中逻辑:根据事件启动warroom的区域、应用、事件级别,匹配起会规则的区域、应用、事件级别,会将加入群组的人加入到warroom会议和创建的移动应用中(移动应用需要配置方可成功加入,详见移动应用管理) 图2
置的仪表盘可以在云运维中心中进行展示。故障管理中,支持接入应用运维管理服务产生的告警,并在云运维中心中进行流转处理。混沌演练中,支持在演练过程中查看应用运维管理的指标数据。 应用监控 接入应用运维管理告警 演练监控 弹性云服务器 资源运维中,可以对弹性云服务器进行批量操作、脚本执
故障时间范围选择 应用拓扑大屏默认显示当前应用下的所有子应用。 图3 应用拓扑(应用层) 点击拓扑上的子应用,查看组件层,展示该子应用下的所有组件,并支持在拓扑顶部切换至查看其它子应用的组件。 图4 应用拓扑(组件层) 点击拓扑上的组件,查看资源层,展示该组件下的所有资源,并支持核心云服务的指标展示
故障模式和演练任务的关系? 故障模式是对云应用进行评估,识别风险,是混沌演练的前提,演练任务将不同的攻击场景组合起来,使用故障注入来模拟对应的故障模式。 父主题: 韧性中心常见问题
度和月度的总体SLO情况,评估整体的服务水平趋势。应用维度SLO支持按照时间和应用维度查看SLO情况,评估每个应用的服务水平。ErrorBuget根据应用的SLO情况计算出错误成本,用以指导变更或其他高风险操作。指标详情可查看表5。 图8 SLO看板 表5 SLO看板数据字典 模块
成长地图 | 华为云 云运维中心 云运维中心(Cloud Operations Center)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。承载华为云确定性运维业务场景,提供故障管理、批量运维、混沌演练等核心特性,实现在安全合规的前提下,云上运维效率提升。 产品介绍
Service,CTS),是华为云安全解决方案中专业的日志审计服务,提供对各种云资源操作记录的收集、存储和查询功能,可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CTS可记录COC的管理事件和数据事件用于审计。 CTS的详细介绍和开通配置方法,请参见CTS快速入门。
故障模式 故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。 操作场景
所属应用 改进事项所属的应用 改进类型 改进事项的类型 改进责任人 改进事项的责任人 期望完成时间 改进事项的期望完成时间 问题现象 问题现象 改进闭环标准 改进事项闭环的标准
COC产品介绍 统一资源管理 应用管理:提供应用和资源关联关系建模能力,满足用户云上资源的集中式管理要求,降低管理成本。 资源管理:同步并纳管用户在云平台上使用的资源实例,构筑资源运维能力底座。 配置管理:提供应用和资源视角的管理能力,以及参数配置集中式看护、全生命周期管理的能力。 合规性管理
发起PRR评审的基本参数表 参数名称 说明 PRR评审名称 PRR评审的名称 PRR评审描述 PRR评审的描述 应用名称 PRR评审所属的应用名称 应用责任人 PRR评审所属的应用的责任人 应用介绍 PRR评审所属的应用的介绍信息 应用分类 PRR评审所属的应用的类别信息 评审阶段
问题描述:必填,具体描述问题现网和对现网的影响,支持上传附件 问题来源:非必填,填写问题来源,来源包含事件、告警、WarRoom和主动运维发现。若是处理事件发现的问题则选择事件。 问题发生时间:非必填,填写当前问题发生的时间 问题应用:必填,选择该问题的归属应用 问题级别:必填,选择问题级别,当前包含致命,严重,一般和提示
常规变更(指非紧急、能通过正常程序化的申请、评估、批准、排序、计划、测试、实施和回顾的变更); 紧急变更(为了处理生产环境不可用、紧急满足业务需求而提出的计划外变更,或者来不及走正常流程进行评估审批的变更) 2、变更级别:A级>B级>C级>D级 3、变更场景:支持用户根据业务情况自定义配置 4、变更应用:先选择顶层应用,再选择下层具体的应用范围
创建事件 操作场景 通过Cloud Operations Center创建一个事件单。 前提条件 需要先在应用管理中创建您的应用。 注意事项 确认事件单的内容,并如实填写事件等级。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 事件管理”,单击“创建事件单”,进入“创建事件单”页面。
和应用。 图4 应用固定排班列表 单击列表“操作”列的“编辑”,输入用户名,单击“确定”,可在排班页面查看已添加人员的排班。 图5 应用固定排班添加人员 应用排班+轮班场景 使用场景:适用不同应用按照轮班的班次进行排班。 前置条件:“应用排班”您需要先在应用管理中创建您的应用。 登录COC。
在左侧菜单栏选择“故障管理 > 事件管理”,选择“待处理的”页签,单击事件标题进入“事件详情”页面。 图1 进入事件单详情 单击“启动WarRoom”。 图2 启动WarRoom 填写WarRoom信息后,单击“提交”。 图3 填写WarRoom信息 若在拉起Warroom的时候需要同时拉起群组(群组方式