检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
端到端演练流程。承载华为云SRE在混沌演练上多年的最佳实践,使客户能对云上应用主动地进行风险识别、消减和风险验证,持续提升云应用的韧性。 镜像与武器版本支持声明 COC混沌演练新增了裸金属服务器(BMS)和Flexus应用服务器L实例(HCSS)两种攻击对象,并提供了相应的资源类
待办中心 概述 待办中心主要实现功能:客户华为云主账号(租户主SRE)直接创建任务给下属的某些IAM账号(租户子SRE)去处理(如一个公司下有不同部门,每个部门分别有一个IAM账号)。 新增待办 登录COC。 在左侧导航栏选择“任务管理 > 待办中心”页面,进入待办中心列表界面。
审计与日志 审计 云审计服务(Cloud Trace Service,CTS),是华为云安全解决方案中专业的日志审计服务,提供对各种云资源操作记录的收集、存储和查询功能,可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CT
9。 1.0.9 接入方式 接入方式有三种:直连接入(内网)、直连接入(公网)和代理接入。 直连接入(内网):华为云主机,使用直连接入(内网)的方式。 直接接入(公网):非华为云主机,使用直连接入(公网)的方式。 代理接入:通过选择已配置代理机的代理区域,使用代理接入的方式远程安装UniAgent。
险。 图3 变更风控&作业可信 标准化故障管理 标准化故障管理流程,加持WarRoom驾驶舱,实现故障高效协同和快速恢复。 标准化流程:华为云标准故障处理流程服务化,通过WarRoom实现运维、研发等多兵种协同作战,响应预案提升故障处理效率。 运维知识库:基于历史故障和专家经验构
9。 1.0.9 接入方式 接入方式有三种:直连接入(内网)、直连接入(公网)和代理接入。 直连接入(内网):华为云主机,使用直连接入(内网)的方式。 直连接入(公网):非华为云主机,使用直连接入(公网)的方式。 代理接入:通过选择已配置代理机的代理区域,使用代理接入的方式远程安装UniAgent。
快速配置中心 COC快速配置中心面向华为云全局云服务提供场景化的集中配置入口,通过最佳实践的极简配置实现多区域、多账号、定时的自动化操作,为后续运维降低操作门槛。 操作场景 通过快速配置中心进行不同场景资源的快捷配置。 云运维中心配置 登录COC。 进入COC“总览”后,可以看到快速配置中心。
如果您需要对您所拥有的COC的资源运维操作进行精细的权限管理,您可以使用统一身份认证服务(Identity and Access Management,简称IAM),如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳过本章节,不影响您使用ECS服务的其它功能。 默认情况下,新建的IAM用户没有
WarRoom 提供人工以及自动两种拉起Warroom方式,基于起会规则快速拉起Warroom群组。提供Warroom作战平台、关键监控数据看板集成、关键变更操作集成、故障恢复操作平台。支持内外部Warroom联动,协助客户进行问题解决。 Global 流转规则 流转规则将所有接收的集成原始告
单击“更新通告”,根据页面提示,填写完通报内容,单击“确定”,可以更新通告。 图1 更新通告 单击“发布”,根据页面提示,填写完发送信息,单击“确定”,可以发布通告。 若通报对象中选择排班,请在排班管理中创建排班。 父主题: WarRoom
概述 流转规则将所有接收的集成原始告警进行去重操作,支持每个流转规则配置事件时默认分配对象&通知策略,从而实现更准确的通知。 父主题: 流转规则
该原子动作可以用来调用某个云服务注册在API Explorer上的OpenAPI。如果OpenAPI是一个异步调用,可以使用等待API结果原子动作来等待目标对象达到预期状态。 操作步骤 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“作业管理”,进入“作业管理”页面。 图1 作业管理页面
等待API结果 该原子动作可以用来等待目标对象达到预期的状态。如通过执行API原子动作调用ECS的StartServer接口后,再通过等待API结果原子动作调用ECS的ShowServer接口,直到接口响应中的状态变为ACTIVE,即状态为运行中,才判定ECS实例已经启动成功。 操作步骤
发,按照风险分析、应急预案、演练执行、复盘改进4个维度,提供端到端混沌演练能力; 沉淀故障模式:首创基于容错视角的故障场景分析方法,沉淀华为云SRE多年的故障模式库,内置300个+典型故障模式。 图1 全旅程混沌工程 风险分析:分析应用架构,找出风险点。 应急预案:针对风险点,制定应急预案。
图5 应用拓扑(资源层) 选择应用拓扑右侧“告警”页签,查看应用告警,列表展示告警产生时间范围在右侧时间轴内的告警。支持选择左边拓扑对象后,自动筛选选择对象的告警信息。 图6 告警列表 选择应用拓扑右侧“变更”页签,查看应用变更,列表展示变更时间范围在右侧时间轴内的变更。 图7 变更列表
可在流转规则中配置对应事件或告警的响应预案,可选择已有的脚本和作业作为预案。 图7 响应预案 在分派规则部分,选择分派的对象,最后单击下方的“提交”,完成流转规则的创建。 图8 分派规则 步骤三:通知管理配置通知场景、通知对象、通知方式 登录COC。 在左侧导航栏选择“基础配置 > 通知管理”页面,单击“创建通知”。
资源运维中,可以对裸金属服务器进行批量操作、脚本执行、作业执行、定时任务等运维操作。 资源运维 对象存储服务 资源运维中,支持对弹性云服务器进行文件上传和分发,如需使用文件传输能力,需要在对象存储服务中购买存储桶。 执行公共脚本 数据加密服务 资源运维中,参数中心支持用户创建加密参数
createJobScript 删除自定义脚本 Document deleteJobScript 修改自定义脚本 Document editJobScript 审批自定义脚本 Document approveJobScript 执行脚本 Document executeJobScript
如您有相关需求,请联系COC侧沟通处理。 在使用云运维中心COC时,您需注意以下使用限制,详见表1。 表1 云运维中心使用限制 功能模块 对象 使用限制 公共 补丁/脚本/作业/ECS操作 单个操作任务最多支持选择200台实例。 补丁/脚本/作业/ECS操作 执行工单时,超时时间小于等于86400秒(即24小时)。
开通云运维中心 新用户首次登录云运维中心 COC,由于COC提供了对云服务资源的自动化运维、故障管理等能力,需要获得访问其他云服务的委托权限。COC需要创建名为ServiceLinkedAgencyForCOC和ServiceAgencyForCOC的委托。委托包含的权限可见表1以及表2。