检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
资源总览 提供用户查看所购买资源(包含弹性云服务器、弹性公网IP、云数据库等)的能力。 操作场景 通过Cloud Operations Center查看资源(包含弹性云服务器、弹性公网IP、云数据库等)。 操作步骤 登录COC。 进入COC“总览”后,可以查看对应的资源信息。 图1
(CCE)攻击场景 如果选择攻击目标来源为云数据库(RDS),则选择指定的云数据库实例,单击“下一步”。 图10 选择攻击目标为云数据库(RDS) 选择云数据库(RDS)攻击场景并填写场景的攻击参数,单击“完成”即可。 图11 云数据库(RDS)攻击场景 如果选择攻击目标来源为分
云运维中心中的故障管理、资源运维等场景中,支持发送短信、邮件、语音、企业微信、钉钉等通知。如需使用需要先开通消息通知服务。 通知管理 云数据库 资源运维中,可以对云数据库进行批量操作。混沌演练中,支持对云数据库进行演练任务执行。 资源运维 混沌演练 裸金属服务器 资源运维中,可以对裸金属服务器进行批量操作、脚本执行、作业执行、定时任务等运维操作。
填写任务名称,操作描述。 图6 填写基本信息 单击“输入”,按需选择service(产品短名)、apiName(api名称),如选择云数据库的ListSlowLogsNew(查询数据库慢日志)OpenAPI,显示具体的OpenAPI定义。 填写所需OpenAPI参数内容。 图7 添加输入信息 单击
作业管理页面 选择“自定义作业”页签,单击“创建作业”,进入“创建作业”页面。 图2 单击创建作业 填写作业基本信息,包含作业名称,企业项目,描述和标签。可按照标签管理中的步骤创建标签,填写完成后单击“下一步”。 图3 填写作业基本信息 选择作业模板,如果没有合适的模板,选择“自定义”,单击“下一步”。
资源类型 目前支持纳管的资源类型: 弹性云服务器 ECS 目前支持托管(帐号导入)的资源类型: 弹性云服务器 ECS、分布式缓存服务 DCS、云数据库 RDS、分布式消息服务 DMS 帐号基线 基线帐号数量≤30个,关联的组件数量≤100个。
常规变更&紧急变更的区别? 概念上的区别 常规变更(指非紧急、能通过正常程序化的申请、评估、批准、排序、计划、测试、实施和回顾的变更)。 紧急变更(为了处理生产环境不可用或机器不可用、紧急满足业务需求而提出的计划外变更,无法满足计划性要求,或者来不及走正常流程进行评估审批的变更)。
故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。 操作场景 您可以对应用可能发生的
COC服务提供了3级可靠性架构,通过AZ内(Availability Zone,可用区)实例容灾、多AZ容灾、数据定期备份技术方案,保障服务的持久性和可靠性。 表1 COC服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,COC实例通过多实例方式实现实例容灾,快速剔除故障节点,保障COC实例持续提供服务。
审计服务,提供对各种云资源操作记录的收集、存储和查询功能,可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CTS可记录COC的管理事件和数据事件用于审计。 CTS的详细介绍和开通配置方法,请参见CTS快速入门。 日志 用户
故障模式是什么? 故障模式是对云应用面临的潜在风险进行分析和评估的结果,混沌演练平台预置华为云多年积累的故障模式数据,使用FT-FMEA故障分析法帮助您分析云应用存在的潜在风险。 父主题: 韧性中心常见问题
智能关联资源 提供用户通过企业项目和标签的形式,将企业项目下的相同标签资源创建至同一资源分组内进行管理。 操作场景 通过Cloud Operations Center关联资源到应用下的指定分组中。 注意事项 只有单击对应分组上,智能关联资源按钮才能生效。 触发智能关联资源后,请您
基于策略对云服务进行操作。 根据授权的精细程度,分为角色和策略。角色以服务为粒度,是IAM最初提供的一种根据用户的工作职能定义权限的粗粒度授权机制。策略以API接口为粒度进行权限拆分,授权更加精细,可以精确到某个操作、资源和条件,能够满足企业对权限最小化的安全管控要求。 COC系统策略说明请参考COC权限管理。
根据页面提示,设置新增的影响应用信息。 单击“确定”完成添加。 图1 新增影响应用 在主屏可以看到添加的应用,支持填写故障开始时间、恢复时间及故障描述。提交后该应用的状态会变为恢复状态。 受影响应用支持执行应急预案快速恢复故障、同时可以查看该应用的告警、事件和变更信息。 图2 影响应用页面 父主题: WarRoom
比、趋势图和Top /Bottom排序的方式,呈现事件风险情况。WarRoom中包含受损应用、引起WarRoom事件级别和时间窗,反映重大故障场景的发生和改善情况。回溯改进中包含回溯改进的闭环率和趋势分析,确保对于已发生的故障进行经验沉淀,减少相同故障再次发生的频率和处理时间。指标详情可查看表3。
行权限分配,通过授予用户仅能使用COC,但是不允许删除COC的权限策略,控制开发人员对COC资源的使用范围。 权限根据授权精细程度分为角色和策略。 角色:IAM最初提供的一种根据用户的工作职能定义权限的粗粒度授权机制。该机制以服务为粒度,提供有限的服务相关角色用于授权。由于华为云
图3 添加委托管理员 使用约束 邀请成员账号加入组织之后,管理员或服务委托管理员可以在云运维中心查看和管理该组织下成员账号的数据与资源,支持的跨账号管理的功能有运维态势感知、资源管理和作业管理。 父主题: 开通云运维中心并授权使用
待办中心 概述 待办中心主要实现功能:客户华为云主账号(租户主SRE)直接创建任务给下属的某些IAM账号(租户子SRE)去处理(如一个公司下有不同部门,每个部门分别有一个IAM账号)。 新增待办 登录COC。 在左侧导航栏选择“任务管理 > 待办中心”页面,进入待办中心列表界面。
理流畅度和运维效率。 资源管理驾驶舱:从全局视角实现用户资源可视化管理,支持多云和跨账号集中运维能力。 图2 资源全生命周期管理 变更风控&作业可信 融合华为SRE安全生产最佳实践的管控模型,助力客户作业可信和稳定可靠。 全方位作业可信:构筑人员风险评估、高危命令拦截和自动化稽查
升用户运维能力成熟度和云上运维效率。 图1 COC产品介绍 统一资源管理 应用管理:提供应用和资源关联关系建模能力,满足用户云上资源的集中式管理要求,降低管理成本。 资源管理:同步并纳管用户在云平台上使用的资源实例,构筑资源运维能力底座。 配置管理:提供应用和资源视角的管理能力,