检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
随着传统IT基础设施运维向云服务运维方式的转变,传统的运维手段面临服务间调用复杂、应用迭代速度快、海量运维对象、复杂系统非线性等挑战。业务的停机都会给公司带来巨大的经济损失和声誉影响。 在运维过程中引入混沌工程,通过定期进行演练的方式,可以在现网问题发生前识别系统的薄弱点(软件Bug、
在左侧菜单栏中选择“资源运维”,选择 “资源批量操作”,在“批量ECS操作”模块中单击“重装操作系统”,进入“重装操作系统”页面。 在“重装操作系统”页面,选择“添加实例”。 图1 重装展示操作页 选择“分批策略”。 自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可
批量切换操作系统 操作场景 通过Cloud Operations Center ECS操作批量切换操作系统功能进行ECS实例批量切换系统。 注意事项 如果存在未关机的实例,需要勾选“立即关机”。 如果不存在未关机的实例,则可直接提交执行。 操作步骤 登录COC。 在左侧菜单栏中选择“资源运维”,选择
在左侧菜单栏中选择“资源运维”,选择 “资源批量操作”,在“批量FlexusL操作”模块中单击“重装操作系统”,进入“重装操作系统”页面。 在“重装操作系统”页面,选择“添加实例”。 图1 重装展示操作页 选择“分批策略”。 自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。
击“重装操作系统”,进入“重装操作系统”页面。 在“重装操作系统”页面,选择“添加实例”。 图1 选择实例 选择“分批策略”。 自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分
OS诊断 登录COC。 在左侧菜单栏单击“故障管理 > 诊断工具”,在“OS诊断”模块单击“立即诊断”,进入“创建OS诊断”页面。 图1 OS诊断入口 在“创建OS诊断”页面,单击“添加实例”。实例需提前安装UniAgent,且镜像和规格满足OS诊断要求。 图2 选择实例 在“创
在左侧菜单栏中选择“资源运维”,选择 “资源批量操作”,在“批量FlexusL操作”模块中单击“切换操作系统”,进入“切换操作系统”页面。 在“切换操作系统”页面,选择“添加实例”。 图1 切换展示操作页 选择“分批策略”。 自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。
规性问题突出,OS合规性风险尤为明显,引发客户对云上OS安全合规性担忧;需要周期性检查主机OS补丁的合规性情况,避免主机因为OS补丁缺失产生漏洞,导致业务受损。云上无统一的OS合规性管理和自闭环工具,合规性问题修复困难或求助华为侧协助解决。希望能够自动化的完成OS补丁的扫描,并且
故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。 操作场景 您可以
server 64bit 对于Linux x86_64服务器,支持上表中所有的操作系统及版本。 对于Linux ARM服务器,当前CentOS操作系统支持7.4/7.5/7.6版本,EulerOS操作系统支持2.0版本,Ubuntu操作系统支持18.04版本 操作步骤 登录COC。 在左侧菜单栏选择“资源管理
server 64bit 对于Linux x86_64服务器,支持上表中所有的操作系统及版本。 对于Linux ARM服务器,当前CentOS操作系统支持7.4/7.5/7.6版本,EulerOS操作系统支持2.0版本,Ubuntu操作系统支持18.04版本 操作步骤 登录COC。 在左侧菜单栏选择“资源管理
用。 Token在计算机系统中代表令牌(临时)的意思,拥有Token就代表拥有某种权限。Token认证就是在调用API的时候将Token加到请求消息头中,从而通过身份认证,获得操作API的权限。Token可通过调用获取用户Token接口获取。 调用本服务API需要项目级别的Tok
} ] } 示例3:多个授权项策略 一个自定义策略中可以包含多个授权项,且除了可以包含本服务的授权项外,还可以包含其他服务的授权项,可以包含的其他服务必须跟本服务同属性,即都是项目级服务。多个授权语句策略描述如下: { "Version": "1.1", "Statement":
ReadOnlyAccess 云运维中心服务只读权限 系统策略 无 COC FullAccess 云运维中心服务管理员权限 系统策略 无 表3 常用操作与系统权限的关系列出了COC常用操作与系统权限的授权关系,您可以参照该表选择合适的系统权限。 表3 常用操作与系统权限的关系 操作 COC ReadOnlyAccess
问题管理”,进入“待我处理”的问题列表页面。 点击问题单名称进入问题详情页面,单击右上角“现网实施”,跳转现网实施页面,系统会默认带出涉及的区域,填写区域对应的变更单后,系统会获取变更结果;若部分区域不涉及变更,可点击操作列的“不涉及变更”。 填写完变更信息后,单击右下角的“实施完成”,会走到待验证阶段。
动化任务。 图1 点击此处 填入自动化执行参数,单击“确认配置”。 选择区域后,补丁自动化操作将定时执行该区域中所有Agent正常运行且操作系统为Linux的ECS实例,请自行判断影响范围。 图2 定时任务参数 创建定时任务成功后,可单击页面上方“补丁自动扫描“或“补丁自动修复“进入定时运维页面查看或编辑。
服务韧性 COC服务提供了3级可靠性架构,通过AZ内(Availability Zone,可用区)实例容灾、多AZ容灾、数据定期备份技术方案,保障服务的持久性和可靠性。 表1 COC服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,COC实例通过多实例方式实现实例容
用户能够实现操作系统补丁合规性扫描,操作系统补丁合规性修复功能。 补丁管理当前仅支持能够访问公网的机器,可通过绑定EIP或NAT网关的方式实现,请在功能使用前确认。 在执行补丁管理操作之前,请确认执行机器所在的区域为现支持的区域,操作系统为现补丁管理支持操作系统,机器上具备补丁
集成配置支持简单、快速集成现有或第三方等监控系统;将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 监控系统接入后,配置流转规则后可将告警信息转事件或告警。 当前支持集成CES、AOM、Prometheus和自建监控系统。 集成管理 父主题: 故障管理
批量ECS操作 ECS操作为用户提供了管理ECS实例的能力,支持进行批量开机、关机、重启、切换操作系统、重装操作系统等操作。 批量开机 批量关机 批量重启 批量重装操作系统 批量切换操作系统 父主题: 资源运维