检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Center,简称COC)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。承载华为云确定性运维业务场景,提供变更管理、批量运维等核心特性,实现在安全合规的前提下,提升用户运维能力成熟度和云上运维效率。 COC提供以下功能: 运维态势感知大屏,面向不同角色运维人员的专属运维BI看板,辅助管理层洞察决策和优化改进。
设置“创建应用”。 每个层级的必填字段填写完成需要点击“保存”进入下个层级,所有层级的必填字段填写完毕后,才可以点击“创建”按钮创建应用。 表1 创建应用参数说明 参数 说明 示例 应用结构类型 请根据应用结构的复杂类型选择。 轻量级应用 应用名称 根据命名规则,自定义应用的名称。 测试应用
Cron表达式是一种用于指定定时任务的时间表达式,常用来指定任务的执行时间、执行频率和执行间隔。它由6个字段组成,分别表示秒、分、时、日期、月份、星期。 域取值 表1 Cron表达式域取值 域 允许的数值 允许的特殊字符 备注 秒 0~59 不支持 - 分 0~59 * / 任务的执行间隔大于30分钟。
OS诊断 操作场景 OS诊断是基于华为云积累的大量知识经验和特有的检测算法,通过采集少量GuestOS数据,帮您快速了解服务器整体运行状况并准确提供异常问题排查定位方法。 注意事项、 OS诊断目标实例UniAgent状态需要为运行中,UniAgent相关操作请参考配置UniAgent。
返回结果 状态码 请求发送以后,您会收到响应,其中包含状态码、响应消息头和消息体。 状态码是一组从1xx到5xx的数字代码,状态码表示了请求响应的状态,完整的状态码列表请参见状态码。 对于获取用户Token接口,如果调用后返回状态码为“201”,则表示请求成功。 响应消息头 对应
邀请成员账号加入组织之后,管理员或服务委托管理员可以在云运维中心查看和管理该组织下成员账号的数据与资源,支持的跨账号管理的功能有运维态势感知、资源管理和作业管理。 父主题: 开通云运维中心并授权使用
问题受理后状态为“定位出方案中”,定位出方案中状态可对问题单填写问题定位结果信息、转发责任人、升降级和挂起。 问题单挂起后需要创建单人审核,审批通过后状态为“挂起”,挂起后问题单可手动解除挂起或到达设定的解除挂起时间自动解除挂起。 问题填写定位结果时,若选择需要变更,问题单状态为“待现网实施
改删除时间,则会影响删除前通知时间。 (可选)单击“添加标签”,输入标签的键和值。 标签的键仅支持包含数字、字母和_- . : /= + @特殊字符,限制长度1-128个字符。 标签的值仅支持包含数字、字母和_- . : /= + @特殊字符,限制长度1-256个字符。 单击“确定”,完成参数创建。
、“Bat”三种命令,支持全局参数和关联参数仓库。 脚本内容大小限制1M。 单个租户账号下所有子账号最多支持创建200个脚本。 公共脚本 公共脚本是由云运维中心提供几种常见运维场景的解决方案,脚本详情所有用户可见,公共脚本不支持用户的增加、修改和删除。 父主题: 脚本管理
审批人通过排班场景和排班角色决定。 审批方式:一人通过 或 全部通过。 3、支持添加多个审批环节 注:排班角色需配置具体的审批人才可生效,未配置审批人变更申请将无法提交成功。 编辑审批配置 登录COC。 在左侧菜单栏选择“变更管理 > 变更配置”页面,点击操作列的“编辑”,修改审批配置信息。
作业:在下拉框选择选择作业,支持自定义作业和公共作业。 作业类型的任务,当前暂不支持引用全局参数的作业任务,以及无目标实例的作业。 IAM权限委托:用户授权云运维中心执行作业所能够使用的权限范围。 区域:请选择目标实例所在区域。 目标实例模式:请选择作业步骤和目标实例的执行方式。 所有步骤一致:
/PCI等)的安全合规认证,用户可自行申请下载合规资质证书。 图1 合规证书下载 资源中心 华为云还提供以下资源来帮助用户满足合规性要求,具体请查看资源中心。 图2 资源中心 销售许可证&软件著作权证书 另外,华为云还提供了以下销售许可证及软件著作权证书,供用户下载和参考。具体请查看合规资质证书。
理流畅度和运维效率。 资源管理驾驶舱:从全局视角实现用户资源可视化管理,支持多云和跨账号集中运维能力。 图2 资源全生命周期管理 变更风控&作业可信 融合华为SRE安全生产最佳实践的管控模型,助力客户作业可信和稳定可靠。 全方位作业可信:构筑人员风险评估、高危命令拦截和自动化稽查
在本服务左侧菜单“参数管理 > 参数中心”模块中创建需要选择的参数。 设置“执行用户”和“超时时间”。 执行用户:默认“root”,目标实例节点上执行脚本的用户。 超时时间:默认“300”秒,脚本在单个目标实例上执行的超时时间。 单击“添加实例”,设置“选择实例”。 表2 选择实例参数说明
概述 定时运维页面展示所有定时任务详情和执行记录。您可以在这里创建定时任务,也可以管理已创建的定时任务。创建定时任务后,系统按确定时间或周期定时触发脚本执行、作业管理等操作。 定时运维包含如下几项核心要素: 定时设置:单次执行,周期执行(设置简单周期或Cron表达式)。 任务类型:脚本,作业。
一个可用区是一个或多个物理数据中心的集合,有独立的风火水电,AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 项目 区域默认对应一个项目,这个项目由系统预置,用来隔离物理区域间的资源(计算资源、存储资源和网络资源
删除前通知和未修改通知规则。 删除前通知时间必须小于到期删除时间。 删除前通知时间必须大于参数创建或修改的时间。 未修改通知时间不能小于参数创建或修改的时间。 有到期删除策略时,未修改通知时间不能大于到期删除时间。 (可选)单击“添加标签”,输入标签的键和值。 标签的键仅支持包含数字、字母和_-
企业项目 应急预案所属的企业项目,默认为default 所属应用 预案所属的应用 恢复时长 预期的故障恢复时长 版本号 版本号 摘要 描述应急预案主要信息 填写故障处理,应急预案类型可以选择“自动化预案”和“文档预案”。 若选择“自动化预案”,处理方式可以选择“脚本”和“作业”。 图3
比、趋势图和Top /Bottom排序的方式,呈现事件风险情况。WarRoom中包含受损应用、引起WarRoom事件级别和时间窗,反映重大故障场景的发生和改善情况。回溯改进中包含回溯改进的闭环率和趋势分析,确保对于已发生的故障进行经验沉淀,减少相同故障再次发生的频率和处理时间。指标详情可查看表3。
问题管理 问题管理主要是对应用的所有问题单进行管理,通过识别故障的实际和潜在原因、管理规避方案和已知错误,来降低故障再次发生的可能性和影响性。包含问题单的创建、受理、驳回、转单、处理到闭环整个生命周期管理。问题单来源主要有人工创建与北向接口创建。 问题管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。