检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
功能免费,若后续部分高阶产品能力开始收费,提前30天通知。 云运维中心与其他云服务组合使用,例如为您提供发送通知等增值服务,这些增值服务可能产生额外费用,具体以对应云服务的收费为准,由提供该功能的服务结算。
在下拉列表选择通知的模板,支持多选。 通知的内容模板,由系统内置,不同通知类型关联出的模板列表不同,选择某一个模板后,鼠标悬浮会展示出通知模板的详情。 通知范围 在下拉列表选择通知的范围,支持多选,以应用为单位。 选择某一个服务,举例:当选择A服务时,事件单中出现的也是A服务时,不考虑其他匹配规则的情况下
示资源之间的相互关系,便于资源的使用、监控和管理。 注意事项 支持查看华为云资源的拓扑关系。 支持查看弹性云服务器(ECS)、MapReduce服务 (MRS)、裸金属服务器 (BMS)、云容器引擎 (CCE)的拓扑关系。 查看资源拓扑 登录云运维中心。 在左侧导航栏选择“资源管理
查看审计日志 支持审计的COC操作 通过云审计服务,您可以记录与云运维中心服务相关的操作事件,便于日后的查询、审计和回溯。支持审计的关键操作如表1所示。 表1 支持审计的关键操作列表 操作名称 资源类型 事件名称 创建warroom WarRoom createWarRoom 创建起会规则
事件级别 操作场景 系统提供的事件级别名称描述和业务流程定义的事件级别和描述不符合,支持用户自定义事件级别和描述。修改后会在创建事件单页面显示最新定义的级别。 修改事件级别 登录云运维中心。 在左侧导航栏选择“基础配置 > 流程管理”。 单击“事件流程 > 事件级别”。 选择需要修改的事件级别,单击操作列“修改”。
详情页展示应用故障详情。 (可选)勾选“自动刷新”,自动刷新下拉列表选择刷新频率。 勾选“自动刷新”后,“结束时间”按照刷新频率自动刷新到系统当前时间。 (可选)若应用有子应用,单击子应用。 应用拓扑大屏展示该子应用下的所有组件,右侧详情页展示子应用故障详情。支持在拓扑大屏切换查看其它子应用。
终端节点 终端节点即调用API的请求地址,不同服务不同区域的终端节点不同,您可以从地区和终端节点中查询服务的终端节点。 父主题: 使用前必读
高可用能力。 访问方式 云服务平台提供了Web化的服务管理平台,即管理控制台和基于HTTPS请求的API(Application Programming Interface)管理方式。 API方式 如果用户需要将云服务平台上的云运维中心集成到第三方系统,用于二次开发,请使用API
从SLI/SLO、可冗余、可容灾、可过载控制、可故障管理、可变更能力、可运维、安全生产等维度,对服务可用性及运维能力提出基线要求,在服务产品开发前端构筑能力,进行相关需求规划、设计和开发工作,并在服务上线前进行生产准入审视。 PRR评审是一个管理过程,旨在确保产品立项、产品设计、产品上线的过程符合既定的质量标准和要求。在
SLO期望值)*全年服务总时长(min); 当SLO实际值≤SLO期望值时,ErrorBudget=0; 天/月 分钟 PRR看板 PRR看板(生产就绪程度评审)中包含评审服务汇总、评估雷达分布、服务复盘、改进任务闭环情况。评审服务汇总体现投入生产前各个服务当前所处的评审阶段,以
区域筛选 鼠标移动到云服务图标(云服务图标右上角红底数字代表告警数量)悬停,可以快速查看紧急/重要告警数量,以及资源实例的区域分布。 图3 鼠标悬停查看资源 单击云服务图标,可以查询对应资源类型的全部资源信息。 图4 查询资源信息 单击“查看详情”将会跳转至ECS云服务的实例基本信息页面。
审计与日志 审计 云审计服务(Cloud Trace Service,CTS),是华为云安全解决方案中专业的日志审计服务,提供对各种云资源操作记录的收集、存储和查询功能,可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CT
问题级别 可选项“紧急”、“严重”、“一般”、“提示”。 紧急: 造成系统或应用程序崩溃、死机、系统挂起,或造成数据丢失,主要功能完全丧失,导致本模块或相关模块异常等。 严重: 系统主要功能部分丧失、数据不能保存,系统的次要功能完全丧失,问题局限在本模块,导致模块功能失效或异常退出。
管理跨账号资源 操作场景 云运维中心服务具备安全可靠的跨账号数据汇聚和资源运维能力。当您的账号是企业级账号,且为组织(organizations云服务中设置)中的管理员或者COC云服务的委托管理员时,您可以对组织内其它账号下的资源进行统一的自动化运维操作,避免多账号操作导致的人力
仅通知上升为开启可设置,在下拉列表选择预警通知方式。 单击“确定”。 完成自定义SLA创建。 1、仅自定义SLA支持创建,公共SLA会自动预置在系统里,仅对租户开启“启用”,“禁用”,“查看”功能。 2、创建或修改SLA后,将对新进入SLA流程的工单开始生效,对已处于SLA流程中的工单不会生效。
问题级别 可选项“紧急”、“严重”、“一般”、“提示”。 紧急: 造成系统或应用程序崩溃、死机、系统挂起,或造成数据丢失,主要功能完全丧失,导致本模块或相关模块异常等。 严重: 系统主要功能部分丧失、数据不能保存,系统的次要功能完全丧失,问题局限在本模块,导致模块功能失效或异常退出。
概述 云运维中心的韧性中心提供了应急预案功能,允许用户为系统可能发生的故障建立对应的应急预案。这样,在故障发生后,用户可以参考这些预案进行紧急恢复。创建应急预案的流程包括登录 云运维中心,选择“韧性中心>应急预案”页面,并进行应急预案的自定义创建,包括填写基本信息、选择处理方式(如“脚本”或“作业”)
请填写设备厂家。 华为 操作系统 在下拉列表选择操作系统。 LINUX 描述 可选参数。对设备进行描述。 - 表5 虚拟机参数说明 参数名称 说明 示例 设备名称 自定义设备的名称。 测试设备 私有IP 虚拟机私有IP。 192.168.1.1 操作系统 在下拉列表选择操作系统。 LINUX
根据命名规则,自定义基线的名称。 测试基线 基线类型 参数不支持修改,账号基线的类型。 组件基线 基线账号 账号类型 参数不支持修改,账号的操作系统类型。 仅支持Linux操作系统。 Linux 账号名称 请填写账号名称。 账号名称是资源的主机账号,后续账号改密等功能依赖填写的账号名称。 root 账号分级
问题级别 可选项“紧急”、“严重”、“一般”、“提示”。 紧急: 造成系统或应用程序崩溃、死机、系统挂起,或造成数据丢失,主要功能完全丧失,导致本模块或相关模块异常等。 严重: 系统主要功能部分丧失、数据不能保存,系统的次要功能完全丧失,问题局限在本模块,导致模块功能失效或异常退出。