-
运维态势感知 - 云运维中心 COC
可通过对历史告警数据的分析,了解服务告警的趋势和模式,发现潜在的性能问题或故障隐患。告警成本统计告警人力情况和自动化处理率,运维主管可以利用告警成本有效控制变更的人力成本。告警质量统计事件单和WarRoom的告警发现率,帮助运维主管评估当前告警的有效性,并及时进行告警配置的优化。指标详情可查看表4。
-
编辑账号 - 云运维中心 COC
编辑账号 提供用户对已有的账号进行更新的能力。 操作场景 通过Cloud Operations Center更新云厂商账号。 操作步骤 登录COC。 在“多云配置”页面中单击接入列表中对应云厂商的所在行“操作”列中的“编辑”。 图1 编辑账号 填写信息,具体信息可参考 表1 ,单击“确认”。
-
批量RDS操作 - 云运维中心 COC
批量RDS操作 批量RDS操作为用户提供了管理RDS实例的能力,支持进行批量开启、停止、重启等操作。 批量开启 批量停止 批量重启 父主题: 资源运维
-
批量开机 - 云运维中心 COC
自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。
-
基本概念 - 云运维中心 COC
面向公共租户提供通用云服务的Region;专属Region指只承载同一类业务或只面向特定租户提供业务服务的专用Region。 详情请参见区域和可用区。 可用区(AZ,Availability Zone) 一个可用区是一个或多个物理数据中心的集合,有独立的风火水电,AZ内逻辑上再将
-
管理自定义脚本 - 云运维中心 COC
管理自定义脚本 提供用户修改、删除已录入的自定义脚本的能力。 操作场景 通过Cloud Operations Center修改、删除一个待执行自定义脚本。 注意事项 在修改脚本时确认脚本内容的风险等级,并如实填写风险等级。 操作步骤 登录COC。 在左侧菜单栏选择“自动化运维”,
-
故障模式和演练任务的关系? - 云运维中心 COC
故障模式和演练任务的关系? 故障模式是对云应用进行评估,识别风险,是混沌演练的前提,演练任务将不同的攻击场景组合起来,使用故障注入来模拟对应的故障模式。 父主题: 韧性中心常见问题
-
转移资源 - 云运维中心 COC
转移资源 提供用户将已关联的资源转移至其它的分组内进行管理。 操作场景 通过Cloud Operations Center转移已关联的资源到其它应用下的指定分组中。 注意事项 只有资源所属的企业项目与应用所属的企业项目相同时才可转移。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理
-
补丁修复 - 云运维中心 COC
熔断阈值:用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 图3 熔断策略 设置是否允许重启。 部分补丁需要重启生效,若选择否,则需要您择期安排重启 确认执行信息,若无误则单击“确定”。 图4 执行信息界面 父主题: 补丁管理
-
概述 - 云运维中心 COC
从SLI/SLO、可冗余、可容灾、可过载控制、可故障管理、可变更能力、可运维、安全生产等维度,对服务可用性及运维能力提出基线要求,在服务产品开发前端构筑能力,进行相关需求规划、设计和开发工作,并在服务上线前进行生产准入审视。 父主题: PRR评审
-
应用资源建模 - 云运维中心 COC
管理您的资源和应用,包括同步资源、创建应用并建模、执行UniAgent操作等。主要操作如下: 同步资源:获取当前用户所属的所有Region下资源数据并同步至COC。 创建应用并建模:通过应用资源建模,按业务逻辑单元便捷地进行资源管理。 执行Agent操作:给对应机器资源执行UniAgent的安装、升级和卸载操作。
-
管理自定义作业 - 云运维中心 COC
根据作业名称,在“操作”列选择要执行的操作,包括“执行”、“编辑”、“克隆”、“删除”。 修改作业:单击“修改”,可按照创建自定义作业中的操作步骤进行修改,单击“取消”可放弃本次修改,单击“提交”会更新作业,并递增作业的版本号。 克隆作业:单击“更多 > 克隆”,可按照创建自定义作业中的操作步骤进行修改,单
-
运维基础配置 - 云运维中心 COC
则触发条件时向指定人员发送消息,实现了自动通知的功能。 人员管理 人员管理为云运维中心提供了统一的人员数据管理。您可以在人员管理页面管理当前租户下的用户,人员管理中的用户从 IAM 同步,人员管理页面的数据作为云运维中心的用户基础数据,供创建待办、定时运维、通知管理、事件中心等多
-
切换操作系统 - 云运维中心 COC
自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。
-
资源操作工单 - 云运维中心 COC
资源操作工单 提供用户查看资源操作工单的能力。 前提条件 用户使用ECS操作、RDS操作,系统生成对应的工单。 操作场景 通过Cloud Operations Center查看ECS工单、RDS工单。 操作步骤 登录COC。 在左侧导航栏选择“任务管理 > 执行记录”页面,选择“资源操作工单”页签。
-
补丁基线 - 云运维中心 COC
补丁基线提供了用户可以自定义扫描以及安装的规则的能力,通过自定义补丁基线,补丁扫描安装时会通过用户所设置的补丁基线进行补丁的过滤筛选,扫描或者修复符合基线的补丁。 补丁基线拥有ECS以及CCE两种使用场景,用户可以根据具体使用场景,创建合适的补丁基线。 Cloud Operations Ce
-
创建排班 - 云运维中心 COC
固定班次:对人员进行固定排班管理,直接为排班角色设置相应的人员。 轮班(周一 -- 周日):对人员进行轮班管理,可根据轮班规则,按照时间生成对应的排班 排班维度 全局排班:排班不考虑您创建的应用,即设置的排班与应用无关 应用排班:排班需按照应用,Region(可选)创建,不同应用排班不同
-
产品功能 - 云运维中心 COC
批量ECS操作为用户提供了管理ECS实例的能力,支持进行批量开机、关机、重启、切换操作系统、重装操作系统等操作。 Global 批量RDS操作 批量RDS操作为用户提供了管理RDS实例的能力,支持进行批量开启、停止、重启等操作。 Global 批量FlexusL操作 批量Flexus
-
身份认证与访问控制 - 云运维中心 COC
用户访问COC的方式包括:COC控制台、API、SDK,无论哪种访问方式,其本质都是通过COC提供的REST风格的API接口进行请求。 COC的接口支持认证请求,经过认证的请求需要包含一个签名值,该签名值以请求者的访问密钥(AK/SK)作为加密因子,结合请求体携带的特定信息计算而
-
执行自定义脚本 - 云运维中心 COC
自动分批:用户选择的待执行机器,会根据默认规则,分成多批。 手动分批:用户可以根据自身需要,将待执行的机器,分成若干批,控制机器所在的批次。 不分批:用户所有待执行的机器会全部在同一批次。 图5 选择分批策略 设置“熔断策略”。 熔断策略:用户可以设置执行的成功率,当执行失败的机器数量到