检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
故障模式和演练任务的关系? 故障模式是对云应用进行评估,识别风险,是混沌演练的前提,演练任务将不同的攻击场景组合起来,使用故障注入来模拟对应的故障模式。 父主题: 韧性中心常见问题
随着传统IT基础设施运维向云服务运维方式的转变,传统的运维手段面临服务间调用复杂、应用迭代速度快、海量运维对象、复杂系统非线性等挑战。业务的停机都会给公司带来巨大的经济损失和声誉影响。 在运维过程中引入混沌工程,通过定期进行演练的方式,可以在现网问题发生前识别系统的薄弱点(软件Bug、方案设计
事件类别 操作场景 系统提供的事件类别名称和业务流程定义的事件类别不符合,支持用户自定义事件类别,修改后可在创建事件页面查看最新的事件类别。 新建事件类别 登录云运维中心。 在左侧导航栏选择“基础配置 > 流程管理”。 单击“事件流程 > 事件类别”。 单击“新建事件类别”。 表1
填写演练任务基本信息,包括演练任务名称和期望恢复时长,单位为分钟。 图10 演练任务基本信息 选择攻击任务,默认有1个攻击任务组,单击“添加新的任务组”可添加新的任务组,单击“添加一个新的攻击任务”弹出“添加新的攻击任务”界面。 图11 选择攻击任务 添加新的攻击任务,可以选择创建攻击任务
设置“收藏配置”。 企业项目:勾选需要收藏的企业项目。 单击“确定”。 进行二次确认,单击“确定”。 完成企业项目收藏。 查看已收藏企业项目的资源 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击筛选框左侧下拉列表,选择“已收藏的企业项目”。 父主题: 资源管理
自动化预案:可以通过脚本和作业进行故障恢复的预案。 文档预案:需要通过人工按步骤执行恢复动作进行故障恢复的预案。 处理方式:可选项“脚本”、“作业”,文档预案还可以选择“不涉及”。 脚本:在下拉列表选择选择脚本,支持自定义脚本和公共脚本。 作业:在下拉列表选择选择作业,支持自定义作业和公共作业。
同样在我的凭证下,您可以查看项目ID。 企业项目 企业项目是项目的升级版,针对企业不同项目间的资源进行分组和管理,是逻辑隔离。企业项目中可以包含多个区域的资源,且项目中的资源可以迁入迁出。 关于企业项目ID的获取及企业项目特性的详细信息,请参见《企业管理用户指南》。 父主题: 使用前必读
使用COC服务。 根据企业用户的职能,设置不同的访问权限,以达到用户之间的权限隔离。 将COC服务的相关操作委托给更专业、高效的其他华为云账号或者云服务,这些账号或者云服务可以根据权限进行代运维。 如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳过本章节,不影响您使用COC服务的其它功能。
操作场景 系统提供的事件级别名称描述和业务流程定义的事件级别和描述不符合,支持用户自定义事件级别和描述。修改后会在创建事件单页面显示最新定义的级别。 修改事件级别 登录云运维中心。 在左侧导航栏选择“基础配置 > 流程管理”。 单击“事件流程 > 事件级别”。 选择需要修改的事件级别,单击操作列“修改”。
生成事件的流程是什么? 生成事件有三种方式:手动创建事件、告警转事件和通过流转规则自动生成事件,具体介绍如下。 手动创建事件 在故障管理>事件管理创建事件单,具体操作详见创建事件单。 告警转事件 在故障管理>事件管理创建事件单,具体操作详见告警转事件。 流转规则自动生成事件 流转规则自动生成事件,需要做以下步骤:
混沌演练是什么? 混沌演练是通过主动在系统中模拟软件或硬件故障,并根据系统在各种压力下的表现行为确定优化策略的一种系统韧性保障手段。一个完整的混沌演练包括前期的故障模式分析,中期的故障注入和后期的复盘改进。 父主题: 韧性中心常见问题
操作场景 变更管理中系统默认的变更场景字段和实际业务使用过程中有差异,支持修改变更场景枚举值。 开启/关闭变更场景 登录云运维中心。 在左侧导航栏选择“基础配置 > 流程管理”。 单击“变更场景”。 选择需要开启/关闭的变更场景,单击是否开启列开关。 调整变更场景的开启/关闭状态,关闭后会取消当前变更场景。
故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。您可以对应用可能发生的故障点进行分析,
对应API接口:自定义策略实际调用的API接口。 授权项:自定义策略中支持的Action,在自定义策略中的Action中写入授权项,可以实现授权项对应的权限功能。 依赖的授权项:部分Action存在对其他Action的依赖,需要将依赖的Action同时写入授权项,才能实现对应的权限功能。 IAM
您可以创建待办任务给指定人员处理,设置截止时间,填写待办任务的推荐方案,创建待办后可通过短信、邮件等方式通知责任人,创建待办任务时还支持设置标签和添加附件。 注意事项 全部待办仅显示与当前登录账号(创建人或责任人是当前用户)的待办,其他子账号的待办数据不会显示。 创建待办 登录云运维中心。 在左侧导航栏选择“任务管理
用户被授予的策略中,一个授权项的作用如果同时存在Allow和Deny,则遵循Deny优先。 如果您给用户授予COC FullAccessPolicy的系统策略,但不希望用户拥有COC FullAccessPolicy中定义的删除文档的权限,您可以创建一条拒绝删除文档的自定义策略,然后同时将COC
系统提供的事件暂停和事件降级默认流程,支持用户自定义事件暂停和降级审批流程,流程修改后可在事件处理页面发起申请和审批。 事件降级和暂停审批流程配置生效后创建的事件单流程才会生效,配置流程之前不会生效。 事件在已受理状态可进行升降级和暂停操作。 事件闭环之前需要将升降级和暂停的电子流闭环。
s。 登录账号:登录主机的账号。当操作系统为Linux时,建议使用root账号,可保证有足够的读写权限。 登录端口:访问主机的端口。 认证方式:认证方式为密码。 密码:登录主机的密码。 连接测试结果:连接测试的结果,测试安装机和需安装主机间的网络连通性。 操作:连接测试。 说明:
新用户首次登录云运维中心 COC,由于COC提供了对云服务资源的自动化运维、故障管理等能力,需要获得访问其他云服务的委托权限。COC需要创建名为ServiceLinkedAgencyForCOC和ServiceAgencyForCOC的委托。委托包含的权限可见表1以及表2。 图1 开通COC 表1
补丁基线支持用户自定义配置。用户可通过所设置的补丁基线对实例的补丁进行扫描,修复不符合基线的补丁。 补丁基线拥有弹性云服务器(ECS)、云容器引擎(CCE)和裸金属服务器(BMS)三种使用场景,用户可以根据具体使用场景,创建合适的补丁基线。 云运维中心提供了各操作系统的公共补丁基线作为初始ECS和BMS场景默认