检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
以在使用脚本对弹性云服务器 (ECS)进行攻击时,可能会导致资源使用率飙高、网络发生故障等异常现象,从而存在将弹性云服务器 (ECS)上已安装的UniAgent状态变成离线/异常的风险,请悉知。 创建自定义故障 通过Cloud Operations Center创建一个自定义故障攻击场景的演练任务。
您的资源实例信息已经同步到COC中,具体操作指导请见:同步资源; 您的资源实例已经安装UniAgent且UniAgent运行正常、状态为“运行中”; 在实例上安装UniAgent,需要您提供实例的管理员账号密码,若您的资源实例未安装UniAgent且您已忘记密码,则无法安装UniAgent、导致无法执行重置密码的公共脚本,请知悉!
概述 PRR: Production Readiness Review 生产就绪程度评估基线。 从SLI/SLO、可冗余、可容灾、可过载控制、可故障管理、可变更能力、可运维、安全生产等维度,对服务可用性及运维能力提出基线要求,在服务产品开发前端构筑能力,进行相关需求规划、设计和开
步骤二:安装UniAgent 在“资源管理”页面,勾选目标弹性云服务器,选择“UniAgent>安装”,进入安装UniAgent页面。 图2 安装UniAgent 单击 “手动安装”,进入手动安装UniAgent页面。 图3 安装UniAgent页面 根据页面的运行安装命令进行手动安装UniAgent。
资源列表,并提供UniAgent安装能力。 Global 应用管理 COC提供以应用为中心的资源管理视图。提供应用和资源关联关系的建模能力。按照“应用 > 区域 > 分组 > 资源模型”进行管理,支持按照标签查询资源列表,并提供UniAgent安装能力。 Global 补丁管理
不合规-缺失:补丁符合基线,但是尚未安装。 不合规-失败:补丁进行了修复操作,但是修复失败。 图15 补丁合规性报告摘要界面 状态说明: 合规-已安装:补丁符合补丁基线,已经安装在ECS实例上,并且没有可用更新。 合规-已安装其他:补丁未包含在补丁基线中,但已安装到ECS实例上。 不合规-已安装待重启:补
为您讲解COC各类功能的详细操作使用流程,帮助您从0到1构建运维驾驶舱。 运维总览 资源总览 运维沙盘 人员与排班 人员管理 排班管理 资源管理与运维 资源管理 应用管理 补丁扫描与修复 自动化运维 脚本管理 作业模板与执行 定时运维 故障管理 配置和应用流转规则 标准化事件管理流程 集成告警
-installed_time:补丁安装时间 patch_status 否 String 补丁状态 INSTALLED:已安装 INSTALLED_OTHER:已安装其他 MISSING:缺失 REJECT:拒绝 FAILED:失败 PENDING_REBOOT:已安装待重启 classification
诊断”页面。 图1 OS诊断入口 在“创建OS诊断”页面,单击“添加实例”。实例需提前安装UniAgent,且镜像和规格满足OS诊断要求。 图2 选择实例 在“创建OS诊断”页面,勾选“同意安装插件并采集数据《GuestOS诊断服务前端数据授权》”,单击“提交”。 图3 勾选授权协议,提交诊断
案 表1 不同合规性状态的解决方案 不合规状态 解决方案 失败 查看生成此合规性报告的补丁工单日志,根据失败的日志解决此问题 已安装待重启 补丁已安装修复,待机器重启后生效,机器重启后扫描即可解决不合规问题 已拒绝 在补丁基线中拒绝了此补丁,合规性报告中显示为已拒绝,若需要取消拒绝,请到补丁基线中编辑相应基线
运维态势感知BI 面向不同角色运维人员的专属运维BI看板,辅助运维优化改进和洞察决策。 指标项丰富:预置接入30个+运维指标,构建7张运维态势感知大屏,从宏观到微观全面呈现运维全局态势,提供企业级运维沙盘。 图1 运维沙盘 资源全生命周期管理 提供资源定义、申请、发放、运维、变配&续期、回收等
手动输入脚本参数 图3 参数仓库选择脚本参数 表1 参数联动模式说明表 参数联动模式 说明 使用对应环境最新参数值 脚本执行时使用该参数,参数值为实时从参数仓库对应区域中获取的最新参数值 若脚本入参设置方式需选择“参数仓库”,请提前在本服务左侧菜单“参数管理 > 参数中心”模块中创建需要选择的参数。
20210525 UniAgent客户端 当CPU使用率大于10%或者内存大于200M时,UniAgent客户端将自动重启。 UniAgent安装 单次最多可安装100台UniAgent主机。 应用管理 应用 租户创建的应用层级≤5层。 补丁管理 补丁基线 租户创建的补丁基线个数≤50个(不计入公共基线)。
返回结果 状态码 请求发送以后,您会收到响应,其中包含状态码、响应消息头和消息体。 状态码是一组从1xx到5xx的数字代码,状态码表示了请求响应的状态,完整的状态码列表请参见状态码。 对于获取用户Token接口,如果调用后返回状态码为“201”,则表示请求成功。 响应消息头 对应
资源管理常见问题 首次安装UniAgent如何操作? 如果资源无法在资源管理页面中查询到,如何处理? 无法找到应用管理层级说明页面?
补丁管理常见问题 补丁基线不生效? 补丁基线中安装规则基线与自定义基线的区别? 补丁工单日志中出现all mirrors were tried异常如何处理? 机器无法选择? 补丁修复后合规性报告仍然为不合规如何处理? 补丁操作出现lsb_release not found异常如何处理?
SLO指标配置 登录COC。 在左侧菜单栏选择“基础配置 > SLO管理”,进入“SLO管理”页面。 在SLO管理列表中,选择对应“操作”列中“指标配置”,进入到SLO指标配置页面,选择添加,编辑,删除SLI指标。 图1 SLI指标配置 单击右下角“创建”完成指标配置。 父主题:
如果添加新的攻击任务方式为选择已经,则在下方攻击任务列表中选择之前创建的攻击任务,单击“确认”。 图17 选择已有攻击任务 单击“完成配置”,即可完成演练任务的创建。 图18 完成配置 步骤五:演练报告 演练结束后可以创建演练报告 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,可以查看演练任务列表。
变更中心 变更中心主要承载变更流程管理业务,以变更工单模式,从变更的申请、审批、执行三个大环节管控变更业务,为变更人员、变更管理人员提供统一管理平台。 核心能力:当前支持变更管理、变更配置等能力。 创建变更单 审批变更单 实施及闭环变更单 父主题: 变更管理
多云配置 创建账号 编辑账号 删除账号 导入IDC离线资源 编辑IDC离线资源 删除IDC离线资源 父主题: 应用资源管理