检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
全旅程混沌工程方案 实践场景 某电商企业的新应用已经部署生产环境,计划正式启动接入和引流,其传统运维模式日常运维工作以被动救火为主,缺乏主动运维理念和工具能力;应用上线前无有效途径识别可用性问题,上线后可用性现状无法精确掌握,运维团队缺少故障应急能力和实战经验;希望通过混沌演练对应用在生产环
应用监控 提供用户自定义添加应用,查看应用监控信息的能力。 操作场景 通过Cloud Operations Center查看应用运维管理中仪表盘信息。 操作步骤 登录COC。 进入COC“总览”后,可以查看应用监控信息。 单击“ 自定义看板”设置需要监控的应用。 图1 应用监控信息
S)磁盘、虚拟私有云(VPC)实例等。 同步资源操作:需要当前用户具有rms:resources:list权限。该权限将用于调用RMS服务接口,获取当前用户所属的所有Region下资源数据。 操作场景 通过Cloud Operations Center同步资源信息。 注意事项 触
集成管理 集成配置支持简单、快速集成现有或第三方等监控系统;将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 监控系统接入后,配置流转规则后可将告警信息转事件或告警。 当前支持集成CES、AOM、Prometheus和自建监控系统。
总览 为用户提供资源健康度、资源监控信息、安全概览、运维能力、系统公告等相关信息,呈现基于资源一站式的信息概览。 运维事务中心 快速配置中心 资源总览 资源监控 应用监控 安全概览 运维态势感知
资源监控 提供用户查看CES监控信息的能力。 操作场景 通过Cloud Operations Center查看CES监控信息。 操作步骤 登录COC。 进入COC“总览”后,可以查看CES监控的指标信息。 图1 CES监控信息 选择“存储监控”、“网络监控”、“站点监控”页签,查看不同监控信息。
应用管理 应用管理,即为管理应用与云资源的关系,并为后续资源的监控、自动化运维等,提供统一、及时的资源环境管理服务。 创建应用 修改应用 删除应用 编辑应用拓扑 创建组件 修改组件 删除组件 创建分组 修改分组 删除分组 手动关联资源 智能关联资源 转移资源 解除关联资源 执行UniAgent操作
Gigabytes exceeded the upper limit."或 CreateRootVolumeTask-fail: call evs api - create volume fail :{"error_msg":"volume gigabytes exceeded volume
资源运维常见问题 补丁管理常见问题 自动化运维常见问题 批量操作常见问题 参数管理常见问题 资源运维权限和授权项说明
自动化运维常见问题 审批人无法接收通知? 自定义脚本参数输入值无效? 实例无法选择? 如何在不重启实例的情况下重置密码? 父主题: 资源运维常见问题
资源管理 同步资源 执行UniAgent操作 查看资源详情 查看资源拓扑 父主题: 应用资源管理
多云配置 创建账号 编辑账号 删除账号 导入IDC离线资源 编辑IDC离线资源 删除IDC离线资源 父主题: 应用资源管理
脚本管理 提供用户自定义脚本的创建、修改、删除以及在目标虚拟机上执行自定义脚本、公共脚本的能力。通过该功能,用户可以通过自定义脚本或公共脚本在目标实例上执行操作。 创建自定义脚本 管理自定义脚本 执行自定义脚本 执行公共脚本 父主题: 自动化运维
原子动作 原子动作定义了一个具体的操作内容,是作业的最小单位。 执行API 等待API结果 执行内容 父主题: 作业管理
定时运维 定时运维向客户提供了定时或周期性的向特定实例执行特定脚本或者作业的功能。 定时任务管理 定时任务执行记录 Cron表达式使用 父主题: 自动化运维
密钥管理 配置密钥 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“帐号管理”,进入“帐号管理”页面。 在页面右上角点击“密钥管理”按钮,或者通过“帐号管理流程引导”标签下方的“配置密钥”下“立即配置”按钮。 图1 配置密钥 进入“密钥管理”页面,单击“绑定
原始告警 登录COC。 左侧菜单栏选择“故障管理 > 告警管理”,选择“原始告警”页签,查看原始告警列表,页面默认显示一个月的告警信息。 单击击告警列表前可以查看告警其他信息。 图1 原始告警 父主题: 告警管理
WarRoom 为快速恢复业务的运作机制,支撑运维、研发、运营联合作战,保障业务快速恢复而组建的会议。在Warroom页面可以添加与会成员、发送故障进展、添加影响应用等操作。 前提条件 该应用下有正在处理的事件单,在事件处理页面启动WarRoom。 WarRoom状态 故障信息 影响应用管理
处理问题 操作场景 创建问题单后,问题责任人需受理、定位并提交问题解决方案。 受理问题 驳回问题 问题定位出方案中 问题待现网实施 升降级 挂起问题 待验证 父主题: 问题管理
PRR评审 概述 PRR模板管理 PRR评审管理 父主题: 韧性中心