检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
服务韧性 COC服务提供了3级可靠性架构,通过AZ内(Availability Zone,可用区)实例容灾、多AZ容灾、数据定期备份技术方案,保障服务的持久性和可靠性。 表1 COC服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,COC实例通过多实例方式实现实例容
故障模式是什么? 故障模式是对云应用面临的潜在风险进行分析和评估的结果,混沌演练平台预置华为云多年积累的故障模式数据,使用FT-FMEA故障分析法帮助您分析云应用存在的潜在风险。 父主题: 韧性中心常见问题
导入的账号进行自动纳管,可以编辑全局基线或者创建账号基线来添加对应账号,则系统会对这些主机账号密码进行立即纳管。 2、导入形式的DCS、RDS和DMS资源不参与纳管改密,账号密码无法完成自动纳管改密。 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“账号管理”。
单击应用拓扑右侧“变更”。 查看应用变更,列表展示变更时间范围在右侧时间轴内的变更。 单击应用拓扑右侧“故障诊断”。 查看资源的故障诊断数据,可以对应用的DCS、RDS、DMS资源进行诊断。支持选择左边拓扑对象后,自动筛选选择对象的诊断信息。 未创建过诊断或创建新诊断,具体操作如下。 单击“创建诊断”。 选择资源类型和资源。
查看历史告警 操作场景 历史告警显示的是被清除的汇聚告警。当汇聚告警被清除后,您可以在历史告警页签中继续查看汇聚告警的相关信息和处理记录。 注意事项 告警数据留存期为31天,逾期将自动清除。 查看历史告警 登录云运维中心。 在左侧导航栏选择“故障管理 >告警管理”。 单击“汇聚告警
展示工单列表 功能介绍 查询作业工单列表,分页查询 过滤:创建时间开始,创建时间结束、创建人 返回:id、脚本名称、区域、创建人、创建时间、结束时间、总耗时、状态 URI GET /v1/job/script/orders 表1 Query参数 参数 是否必选 参数类型 描述 limit
集成管理 支持用户自主接入告警数据 功能介绍 支持租户将自开发的监控系统按照标准化集成至COC,集成后告警会按照标准格式上报至COC告警中心 URI POST /v1/event/huawei/custom/{integration_key} 表1 路径参数 参数 是否必选 参数类型
SLO管理概述 SLO(服务级别目标,Service Level Object)为业界通用指标,SLO实际值=1-(应用不可用时长/应用总时长)*100%,通常代表服务/应用的质量水平。 在COC中,Warroom、告警、事件(“业务是否中断”属性为“是”的事件单)等运维工单,会
COCServiceAgencyDefaultPolicy COC服务跨账号访问场景下的服务委托策略 所有资源 [包含未来新增项目] 资源批量操作对ECS、RDS等服务实例重启、切换操作系统 表2 ServiceLinkedAgencyForCOC包含的权限 权限 授权项 使用场景 下发agent作业
应用场景 运维态势感知BI 面向不同角色运维人员的专属运维BI看板,辅助运维优化改进和洞察决策。 指标项丰富:预置接入30个+运维指标,构建7张运维态势感知大屏,从宏观到微观全面呈现运维全局态势,提供企业级运维沙盘。 图1 运维沙盘 资源全生命周期管理 提供资源定义、申请、发放、
OS诊断 操作场景 OS诊断是基于华为云积累的大量知识经验和特有的检测算法,通过采集少量GuestOS数据,帮您快速了解服务器整体运行状况并准确提供异常问题排查定位方法。 注意事项 OS诊断目标实例UniAgent状态需要为运行中,UniAgent相关操作请参考配置UniAgent。
配置UniAgent 操作场景 UniAgent的全称是统一数据采集Agent,主要是作为云服务运维系统的底座, 提供中间件指标采集、自定义指标采集能力和脚本下发执行通道。本章介绍UniAgent的安装、重装、升级、卸载和状态同步操作,安装完成后您可以通过UniAgent对资源执行自动化运维。
挂起问题 操作场景 问题单受理后,在定位阶段若需要创单人协助提供数据或其他信息;问题实施阶段变更需要审批等场景。支持问题处理人挂起问题单,问题单挂起后默认需创建人审批,若需修改先审批流程,可参考流程管理。 挂起问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。
概述 变更管理主要为构建运维作业全生命周期的安全生产能力,降低变更风险,主要承载变更流程管理业务。包含变更日历、变更中心、变更配置、变更管控等能力。 变更日历:变更日历主要是根据日历视图展示手动创建变更单的数据,并根据不同状态查看变更分布。 变更中心:变更中心主要承载变更流程管理
审计与日志 审计 云审计服务(Cloud Trace Service,CTS),是华为云安全解决方案中专业的日志审计服务,提供对各种云资源操作记录的收集、存储和查询功能,可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CT
智能关联资源 操作场景 为您提供通过企业项目和标签的形式,将企业项目下的相同标签资源实例关联至同一资源分组内进行管理。 注意事项 需要分组的资源关联方式为智能关联时,才支持智能关联功能。修改资源关联方式相关操作请参考修改分组。 需要先单击对应分组,智能关联资源按钮才能生效。 触发
概述 告警管理功能提供告警数据的收集、纳管和处理。 本功能支持集成多个现有或第三方等监控系统(比如CES、AOM、Prometheus),并将业务下分散的告警信息进行统一收集,生成原始告警。用户可以在集成管理处启用或禁用已有告警源,或者接入第三方监控系统。 本功能还支持汇聚告警的
管理跨账号资源 操作场景 云运维中心服务具备安全可靠的跨账号数据汇聚和资源运维能力。当您的账号是企业级账号,且为组织(organizations云服务中设置)中的管理员或者COC云服务的委托管理员时,你可以对组织内其它账号下的资源进行统一的自动化运维操作,避免多账号操作导致的人力
跨账号管理 概述 云运维中心服务具备安全可靠的跨账号数据汇聚和资源运维能力,如果您的账号由组织管理,您可以在云运维中心对组织内所有成员账号进行统一的资源管理、自动化运维以及运维态势感知,而无需逐个登录到成员账号。 通过COC对组织成员账号进行跨账号管理需要执行以下操作(以A账号管理B账号为例):
什么是云运维中心 云运维中心(Cloud Operations Center,简称COC)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。承载华为云确定性运维业务场景,提供变更管理、批量运维等核心特性,实现在安全合规的前提下,提升用户运维能力成熟度和云上运维效率。