已找到以下 141 条记录
AI智能搜索
产品选择
云运维中心 COC
没有找到结果,请重新输入
产品选择
云运维中心 COC
在搜索结果页开启AI智能搜索
开启
产品选择
没有找到结果,请重新输入
  • 概述 - 云运维中心 COC

    概述 集成配置支持简单、快速集成现有(如华为云CES、AOM)或第三方等监控系统,将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 监控系统接入后,可在原始告警中查看告警信息,通过配置流转规则后可将告警信息转事件或汇聚告警。

  • 与其他云服务的关联 - 云运维中心 COC

    资源运维 对象存储服务 资源运维中,支持对弹性云服务器进行文件上传和分发,如需使用文件传输能力,需要在对象存储服务中购买存储桶。 执行公共脚本 华为云Flexus云服务 资源运维中,可以对Flexus应用服务器L实例进行批量操作、脚本执行、作业执行、定时任务等运维操作。混沌演练中,支持

  • 集成管理 - 云运维中心 COC

    操作场景 每个监控源的集成配置都有独立的集成接入步骤,需要单独接入,各监控源的详细步骤可查看集成接入中各监控集成说明。 接入集成 该步骤介绍华为云监控系统、开源监控系统的接入步骤 登录云运维中心。 在左侧导航栏选择“故障管理 > 集成管理”。 在集成管理配置页面根据业务需要选择要接入的接入源,单击“接入集成”。

  • 概述 - 云运维中心 COC

    概述 账号管理为用户提供针对华为云ECS、RDS、中间件等资源实例的人机帐号密码集中管理能力。多种帐号进行统一收口,避免多资源帐号密码易遗忘、多人知晓密码信息易泄漏等风险,用户可通过帐号管理来获取主机密码,在安全管控下支持无需输入密码可登录linux主机执行命令。账号密码管理、自动改密和免密登录操作如下。

  • 全旅程混沌工程方案 - 云运维中心 COC

    出发,按照风险分析、应急预案、演练执行、复盘改进4个维度,提供端到端混沌演练能力; 沉淀故障模式:首创基于容错视角的故障场景分析方法,沉淀华为云SRE多年的故障模式库,内置300个+典型故障模式。 图1 全旅程混沌工程 风险分析:分析应用架构,找出风险点。 应急预案:针对风险点,制定应急预案。

  • 演练任务 - 云运维中心 COC

    单击“确定”。 若需要添加新的攻击任务,请参考后续步骤。 表2 添加新的攻击任务参数说明 参数 说明 示例 云厂商 请选择云厂商类型。 华为云 攻击目标来源 请选择目标实例的来源。 云容器引擎 (CCE)支持通过选择实例、指定pod、指定数量方式选择攻击目标。 弹性云服务器(ECS)

  • 概述 - 云运维中心 COC

    应急预案进行应对。 COC混沌演练为用户提供一站式的自动化演练能力,覆盖从风险识别、应急预案管理、故障注入到复盘改进的端到端演练流程。承载华为云SRE在混沌演练上多年的最佳实践,使客户能对云上应用主动地进行风险识别、消减和风险验证,持续提升云应用的韧性。 镜像与武器版本支持声明

  • 标准化故障管理 - 云运维中心 COC

    标准化故障管理 实践场景 某智能客服运维人员在处理事件/告警时,事件处理闭环低效,无标准化事故处理流程、无明确故障恢复协同作战阵型、无应急响应预案。同类型故障场景重复出现,无运维经验沉淀,确定性故障场景无法自动恢复。存在多种级别的告警,处理告警缺乏规范性流程且处理效率较低。需要建立标准化的事件流程,实现规范性处理。

  • 约束与限制 - 云运维中心 COC

    约束与限制 云运维中心COC为全局服务,但在部分特殊区域(专属区域、HCSO等)暂不支持,如您有相关需求,请联系COC侧沟通处理。 在使用云运维中心COC时,您需注意以下使用限制,详见表1。 表1 云运维中心使用限制 功能模块 对象 使用限制 公共 补丁/脚本/作业/ECS操作 单个操作任务最多支持选择200台实例。

  • 认证鉴权 - 云运维中心 COC

    认证鉴权 调用接口有如下两种认证方式,您可以选择其中一种进行认证鉴权。 Token认证:通过Token认证调用请求。 AK/SK认证:通过AK(Access Key ID)/SK(Secret Access Key)加密调用请求。推荐使用AK/SK认证,其安全性比Token认证要高。

  • 执行命令 - 云运维中心 COC

    执行命令 操作场景 云运维中心提供了统一操作ECS实例的功能。通过批量ECS执行命令功能,您可以在不登录ECS的情况下,发送脚本命令至单台或多台ECS,快速完成对ECS的日常维护。 注意事项 所选实例处于运行中状态,才能执行此操作。 所选实例UniAgent状态为运行中,才能执行

  • 概述 - 云运维中心 COC

    概述 问题管理是在使用软件产品过程中,发现产品功能缺陷、性能差等问题,记录和解决应用中存在的根本原因问题。其主要目标是降低产品/服务现网故障数量,并提高服务的整体质量促进产品或应用质量的不断完善,防止问题的再次发生。问题管理包含问题单的创建、受理、驳回、转单、处理到闭环整个生命周

  • 创建委托指导 - 云运维中心 COC

    创建委托指导 背景 若您的企业组织存在多个租户账号,您可以使用COC的跨账号能力在创建CES告警规则、执行作业等场景通过一个账号完成多账号多区域的运维任务配置、下发,在此过程中,您需要创建和使用相应的委托,在本章节中,我们将以跨账号创建CES告警规则场景为例,详述如何创建相关委托。

  • 通知管理 - 云运维中心 COC

    通知管理 操作场景 通知管理主要是提供变更、事件、问题等消息通知模板,满足不同阶段和场景的通知诉求。同时支持按需订阅通知,防止信息多,无法获取重要信息。 当产生事件单、问题单、告警单或有变更单时,通知规则会根据事件/问题/告警/变更信息和配置的通知规则进行信息匹配,解析出需要通知

  • 自定义SLA - 云运维中心 COC

    自定义SLA 操作场景 用户可根据实际业务需要,制定所需工单类型的SLA目标规则、预警规则,以便规范工单责任人在日常工作中及时响应处理工单。 查询自定义SLA 登录COC。 在左侧菜单栏选择“基础配置 > SLA管理”页面。 在“SLA”页面选择“自定义SLA”页签,即可查看自定义SLA列表。

  • 创建定时任务 - 云运维中心 COC

    创建定时任务 操作场景 您可以通过定时运维功能对目标实例定时自动执行脚本或作业,提高运维自动化率。 操作路径:资源运维->自动化运维->定时运维->创建定时任务。 创建定时任务 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“定时运维”。

  • 应用诊断 - 云运维中心 COC

    应用诊断 操作场景 当事件创建后,您可以通过应用诊断(全链路故障诊断)功能快速定位故障根因。用户通过应用诊断可以查看应用层、组件层、资源层的关系拓扑,基于资源和应用告警的异常数据,并提供资源核心指标查看与实例诊断能力。 前提条件 已完成在CMDB的应用创建和资源关联,并完成应用拓扑编辑。

  • 自定义故障 - 云运维中心 COC

    自定义故障 操作场景 创建故障模式,可以针对潜在的故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。 注意事项 由于自定义故障完全由您编写的脚本决定,所以在使用脚本对弹性云服务器 (ECS)进行攻击时,可能会导致资源使用率飙高、网络发生故障等异常现象,从而存在将弹性云服务器

  • 构造请求 - 云运维中心 COC

    构造请求 本节介绍REST API请求的组成,并以调用IAM服务的获取用户Token来说明如何调用API,该API获取用户的Token,Token可以用于调用其他API时鉴权。 您还可以通过这个视频教程了解如何构造请求调用API:https://bbs.huaweicloud.com/videos/102987。

  • 影响应用管理 - 云运维中心 COC

    影响应用管理 操作场景 在故障发生时,若有应用受影响,用户可以在WarRoom详情中添加影响应用。对于影响应用,可以通过应用诊断检查应用详情,通过执行预案快速恢复应用。 新增影响应用 WarRoom在启动、故障定界和恢复阶段支持新增影响应用功能。 登录云运维中心。 在左侧导航栏选择“故障管理