服务韧性 COC服务提供了3级可靠性架构,通过AZ内(Availability Zone,可用区)实例容灾、多AZ容灾、数据定期备份技术方案,保障服务的持久性和可靠性。 表1 COC服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,COC实例通过多实例方式实现实例容
操作场景 云运维中心支持查看应用、子应用、组件或分组下已关联的资源容量详情,按照资源类型展示资源核心数据和排名。 查看容量详情 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”。 在左侧应用栏,选择需要查看的应用、子应用、组件或分组,单击右侧“容量”。
资源监控 操作场景 您可以在资源监控快速查看账号下购买资源(例如弹性云服务器、对象存储、云数据库等)的监控指标信息,如ECS的CPU使用率、磁盘读/写带宽,对象存储的存储对象总数、TPS等。 资源监控 登录云运维中心。 进入COC“总览”,查看资源监控,展示CES监控的指标信息。
资源看板 操作场景 您可以在资源看板快速查看账号下购买的资源(例如弹性云服务器、弹性公网IP、云数据库等),以及资源当前的告警信息(在云监控服务CES配置后产生)。 资源看板 登录云运维中心。 进入COC“总览”,查看资源看板。默认展示全部区域的资源。 图1 资源信息 单击右上方。
您可以在云运维中心总览页快速查看资源风险项,该功能使用优化顾问OA服务,提供大量检查项能力和优化建议,例如ECS实例规格检查,资源实例或集群是否开启自动备份等。 优化顾问 登录云运维中心。 进入COC“总览”,查看优化顾问信息。 单击右侧“查看风险项”。 查看TOP10风险项清单。 图1 查看风险项
选择时间后,应用拓扑大屏展示所选时间段内应用和子应用的告警数量,右侧详情页展示应用故障详情。 (可选)勾选“自动刷新”,自动刷新下拉列表选择刷新频率。 勾选“自动刷新”后,“结束时间”按照刷新频率自动刷新到系统当前时间。 (可选)若应用有子应用,单击子应用。 应用拓扑大屏展示该
概述 云运维中心支持对弹性云服务器(ECS)、云数据库(RDS)、Flexus应用服务器L实例(FlexusL)、裸金属服务器(BMS)等多种资源进行批量操作,具体操作包含批量开机、批量关机、批量重启、重装操作系统以及切换操作系统等场景。 支持场景 表1 资源运维支持的资源和场景
业务和数据:用于模拟数据库或文件的异常导致的业务异常,如数据库表删除、数据库不可用等。 事件级别 可选项“P1”、“P2”、“P3”、“P4”、“P5”。 严重程度默认“P1”最严重,“P5”最轻微。 来源 可选项“主动分析”,“已有故障”。 主动分析:主动对应用架构、运行环境等进行风险分析后,形成故障模式。
可选参数。请填写问题发生的时间。 问题应用 在下拉列表选择涉及问题的应用。 问题级别 可选项“紧急”、“严重”、“一般”、“提示”。 紧急: 造成系统或应用程序崩溃、死机、系统挂起,或造成数据丢失,主要功能完全丧失,导致本模块或相关模块异常等。 严重: 系统主要功能部分丧失、数据不能保存,系统的次要功能
删除应用 操作场景 应用创建后,若想删除应用或子应用,请按如下操作进行。 注意事项 当应用或子应用下存在分组、组件或子应用时,此应用或子应用无法删除。必须保证节点下为空才可以删除。 删除应用 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”。
应用管理 概述 创建应用 修改应用 删除应用 应用拓扑 创建组件 修改组件 删除组件 创建分组 修改分组 删除分组 手动关联资源 智能关联资源 转移资源 解除关联资源 查看资源详情 查看容量详情 父主题: 资源管理
概述 参数中心为用户提供安全可靠的数据存储管理。参数可以是保存在云运维中心的任何数据,例如账号、密钥、普通文本等数据。参数支持被脚本、作业等操作引用,支持文本参数和加密数据的全生命周期管理。 父主题: 参数中心
请根据应用结构的复杂类型选择。 轻量级应用 应用名称 根据命名规则,自定义应用的名称。 测试应用 描述 可选参数。对应用进行描述。 - 子应用名称 仅应用结构类型选择大型应用时需要设置。 根据命名规则,自定义子应用的名称。 测试子应用 子应用描述 可选参数。对子应用进行描述。 -
当CPU使用率大于10%或者内存大于200M时,UniAgent客户端将自动重启。 UniAgent安装 单次最多可安装100台UniAgent主机。 应用管理 应用 租户创建的应用层级≤5层。 补丁管理 补丁基线 租户创建的补丁基线个数≤50个(不计入公共基线)。 脚本管理 脚本内容 自定义脚本内容≤4096字节。
华北-乌兰察布-汽车一(cn-north-11) 西南-贵阳一(cn-southwest-2) 节点(rds.nodes) 数据库代理(rds.proxies) 数据库代理节点(rds.proxynodes) 文档数据库服务 DDS 实例(dds.instances) 华北-北京四(cn-north-4) 华南-广州(cn-south-1)
在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”。 在左侧应用栏,展开应用,选择需要关联资源的分组,单击“智能关联资源”。 图1 智能关联资源 智能关联规则支持修改,修改后可以继续智能关联其他符合规则的资源。修改智能关联规则相关操作请参考修改分组。 父主题: 应用管理
创建参数 操作场景 您可以使用创建参数功能来保存数据,例如账号、密钥、普通文本等数据,可以被脚本、作业等操作引用,支持文本参数和加密数据的全生命周期管理。 注意事项 参数策略涉及到参数的删除,配置时请谨慎使用。 创建参数 登录云运维中心。 在左侧导航栏选择“资源运维 > 自动化运维”。
运维知识库:基于历史故障和专家经验构筑运维知识库,实现已知故障快速恢复,未知故障沉淀经验。 图4 标准化故障管理 智能化混沌演练 全旅程混沌工程解决方案,快速评估应用潜在韧性风险,持续看护应用架构。 端到端混沌工程方案:从客户实际业务场景出发,按照风险分析、应急预案、演练执行、演练复盘4个维度,提供端到端混沌演练能力。
应用拓扑 操作场景 应用拓扑以图形的形式呈现,其中节点表示应用层次结构和资源,连线表示之间的关系。为您更加直观地展示应用层次结构和资源之间的相互关系,便于资源的使用、监控和管理。 注意事项 修改拓扑仅支持修改组件之间的连线关系。 修改拓扑不影响应用和组件的层级和功能。 查看和修改拓扑
实践场景 某电商企业的新应用已经部署生产环境,计划正式启动接入和引流,其传统运维模式日常运维工作以被动救火为主,缺乏主动运维理念和工具能力;应用上线前无有效途径识别可用性问题,上线后可用性现状无法精确掌握,运维团队缺少故障应急能力和实战经验;希望通过混沌演练对应用在生产环境的架构韧性
您即将访问非华为云网站,请注意账号财产安全