检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
集成配置支持简单、快速集成现有或第三方等监控系统;将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 监控系统接入后,配置流转规则后可将告警信息转事件或告警。 当前支持集成CES、AOM、Prometheus和自建监控系统。 集成管理 父主题:
HTTP方法 方法 说明 GET 请求服务器返回指定资源。 PUT 请求服务器更新指定资源。 POST 请求服务器新增资源或执行特殊操作。 DELETE 请求服务器删除指定资源,如删除对象等。 HEAD 请求服务器资源头部。 PATCH 请求服务器更新资源的部分内容。 当资源不存在的
coc:instance:reinstallOS 授予重装弹性云服务器操作系统的权限。 coc:instance:changeOS 授予切换弹性云服务器操作系统的权限。 coc:instance:start 授予启动云服务器的权限。 coc:instance:reboot 授予重启云服务器的权限。 coc:instance:stop
总览 提供用户创建运维事务,查看用户的资源健康、资源监控、安全、运维能力、系统公告等相关信息,为用户提供基于资源一站式的信息概览。 运维事务中心 快速配置中心 资源总览 资源监控 应用监控 安全概览 运维态势感知
通过Cloud Operations Center ECS操作批量重启功能进行ECS实例批量重启。 注意事项 已关机的实例无法被选中。 操作步骤 登录COC。 在左侧菜单栏中选择“资源运维”,选择 “资源批量操作”,在“批量ECS操作”模块中单击“批量重启”,进入“批量重启”页面。
应用管理 应用管理,即为管理应用与云资源的关系,并为后续资源的监控、自动化运维等,提供统一、及时的资源环境管理服务。 创建应用 修改应用 删除应用 编辑应用拓扑 创建组件 修改组件 删除组件 创建分组 修改分组 删除分组 手动关联资源 智能关联资源 转移资源 解除关联资源 执行UniAgent操作
ecs:cloudServers:stop 资源运维中批量关闭云服务器 批量重启云服务器 ecs:cloudServers:reboot 资源运维中批量重启云服务器 批量启动云服务器 ecs:cloudServers:start 资源运维中批量启动云服务器 切换弹性云服务器操作系统 ecs:cloudServers:changeOS
t; ecs:cloudServers:rebuild; ecs:cloudServers:changeOS; ecs:cloudServers:showServer; ecs:cloudServers:stop; ecs:cloudServers:reboot; ecs:cloudServers:start;
图5 新增流转规则 根据页面提示,输入规则名称、应用名称等基本信息。 在触发规则部分,选择触发类型,触发规则的数据源下拉选择监控源,并根据相应的监控源的字段的键,配置相应的条件及满足条件的值。 图6 触发规则 可在流转规则中配置对应事件或告警的响应预案,可选择已有的脚本和作业作为预案。
排班管理 排班角色 单个排班场景下的排班角色≤10个。 帐号管理 资源类型 目前支持纳管的资源类型: 弹性云服务器 ECS 目前支持托管(帐号导入)的资源类型: 弹性云服务器 ECS、分布式缓存服务 DCS、云数据库 RDS、分布式消息服务 DMS 帐号基线 基线帐号数量≤30个,关联的组件数量≤100个。
的资源信息等 自动化运维 包括自定义脚本的创建、修改、删除、查询等 事件管理 包括事件的创建、处理、验证及查询 集成管理 主要为用户上报自监控系统的告警至COC 补丁管理 包括补丁管理合规性报告查询相关接口
问题管理 统计改进单的闭环情况 闭环率=已闭环改进单数量/改进单总量*100% 天/月 百分比 监控告警 监控告警将告警信息以直观的图表形式展示,使运维人员快速掌握服务的整体状况,监控告警中含告警分析、告警成本、告警质量三个模块,体现告警管理核心指标。告警分析中提供告警总量、告警
成功率取值范围0~100,可以精确到小数点后一位。 输入登录凭证。 登录凭证: 密码:用户可使用云服务器原密码或重新设置密码,请输入并牢记密码。 密钥对:用户可以选择 密钥对管理 中对应的密钥对。 创建后设置:用户在登录云服务器前,需要先通过重置密码的方式设置密码。 单击“提交”。 图2 重装展示操作页
成功率取值范围0~100,可以精确到小数点后一位。 输入登录凭证。 登录凭证: 密码:用户可使用云服务器原密码或重新设置密码,请输入并牢记密码。 密钥对:用户可以选择 密钥对管理 中对应的密钥对。 创建后设置:用户在登录云服务器前,需要先通过重置密码的方式设置密码。 单击“提交”。 图2 重装展示操作页
流转规则自动生成事件,需要做以下步骤: 登录COC。 同步人员,具体参考人员管理。 设置排班,并给排班中添加排班人员,具体参考排班管理。 集成监控系统,自动上报告警信息,具体参考集成管理。 配置流转规则,根据流转规则生成事件,具体参考配置流转规则。 若事件生成后,想要接收到事件的通知
inc_type_p_shelter_issues 机房问题 shelter issues inc_type_p_monitoring_issues 监控问题 monitoring issues inc_type_p_consulting_issues 业务咨询类 consulting issues
Center查看已关联应用的资源详情。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理 > 应用资源管理”,进入“应用资源管理”页面,选择“应用管理”页签,在“弹性云服务器ECS”模块里选择需要查看资源详情的实例,单击实例名称。 图1 查看详情 在右侧弹窗中即可查看该资源的详情信息。 图2 资源详情信息 父主题:
方案设计不足之处、故障恢复流程卡点等),及早发现系统可用性的问题进行解决,持续提升应用韧性,建立运维信心。对于无法避免的场景(硬件故障、服务器异常下电、网络设备单板故障等)通过提前制定快速恢复应急预案进行应对。 COC混沌演练为用户提供一站式的自动化演练能力,覆盖从风险识别、应急
不同的攻击场景。先填写攻击任务名称,攻击目标来源分为弹性云服务器 (ECS)和云容器引擎 (CCE)。如果选择弹性云服务器 (ECS),则在下方列表里选择对应的机器,单击“下一步”。 图12 选择攻击目标为弹性云服务器 (ECS) 选择攻击场景并填写场景的攻击参数,单击“完成”即
String ecs云服务器ID 最小长度:1 最大长度:64 agent_sn 是 String UniAgent_sn 最小长度:1 最大长度:32 project_id 是 String 项目Id 最小长度:1 最大长度:32 region_id 是 String 服务器所属region