检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
COC系统策略所示,包括了COC基于策略授权中的所有系统策略。策略授权的系统策略与角色授权的系统策略并不互通。 表4 COC系统策略 系统策略名称 描述 策略类别 COCReadOnlyPolicy 云运维中心服务只读权限。 系统策略 COCFullAccessPolicy 云运维中心服务管理员权限。 系统策略
Cron表达式使用 Cron表达式是一种用于指定定时任务的时间表达式,常用来指定任务的执行时间、执行频率和执行间隔。它由6个字段组成,分别表示秒、分、时、日期、月份、星期。 域取值 表1 Cron表达式域取值 域 允许的数值 允许的特殊字符 备注 秒 0~59 不支持 无 分 0~59
清除告警 登录COC。 在左侧菜单栏选择“故障管理 > 告警管理”,选择“汇聚告警 > 当前告警”页签,查看集成告警列表信息。 在集成告警列表中勾选告警单,单击“清除”或“批量清除”。 选择“业务是否中断”,如果选择“否”,继续执行步骤五;如果选择“是”,必须填写“故障发生时间”
获取自定义脚本详情 功能介绍 获取脚本详情 约束条件: 只能查询自定义脚本详情 URI GET /v1/job/scripts/{script_uuid} 表1 路径参数 参数 是否必选 参数类型 描述 script_uuid 是 String 脚本UUID 请求参数 无 响应参数
删除自定义脚本 功能介绍 删除作业脚本:自定义脚本。 URI DELETE /v1/job/scripts/{script_uuid} 表1 路径参数 参数 是否必选 参数类型 描述 script_uuid 是 String 脚本uuid 最小长度:1 最大长度:25 请求参数 无
批量ECS资源切换镜像报错如何处理? 工单执行报错"code":"Ecs.0021","message":"Failed to check Cinder quotas because the number of Gigabytes exceeded the upper limit
故障模式和演练任务的关系? 故障模式是对云应用进行评估,识别风险,是混沌演练的前提,演练任务将不同的攻击场景组合起来,使用故障注入来模拟对应的故障模式。 父主题: 韧性中心常见问题
执行自定义脚本 功能介绍 执行脚本 脚本入参、超时时间、执行用户、资源受限 脚本入参支持20个。 单次下发的机器支持200个。 单次批次内机器数量最大10个。 最大批次数量为20批。 脚本输出的日志总量只支持1MB。 URI POST /v1/job/scripts/{script_uuid}
展示批次列表 功能介绍 查询:批次列表 返回:批次index、批次标签 URI GET /v1/job/script/orders/{execute_uuid}/batches 表1 路径参数 参数 是否必选 参数类型 描述 execute_uuid 是 String 脚本工单的
展示实例状态统计信息 功能介绍 查询:实例状态统计信息。 URI GET /v1/job/script/orders/{execute_uuid}/statistics 表1 路径参数 参数 是否必选 参数类型 描述 execute_uuid 是 String 脚本工单的执行Id
操作脚本工单 功能介绍 操作类型:取消实例、跳过批次、取消整个工单、暂停整个工单、继续整个工单 URI PUT /v1/job/script/orders/{execute_uuid}/operation 表1 路径参数 参数 是否必选 参数类型 描述 execute_uuid 是
查询脚本列表 功能介绍 作业脚本列表:自定义脚本 limit最大为100 URI GET /v1/job/scripts 表1 Query参数 参数 是否必选 参数类型 描述 limit 是 Integer 分页参数:每页返回记录个数限制 最小值:1 最大值:100 marker
开通云运维中心 新用户首次登录云运维中心 COC,由于COC提供了对云服务资源的自动化运维、故障管理等能力,需要获得访问其他云服务的委托权限。COC需要创建名为ServiceLinkedAgencyForCOC和ServiceAgencyForCOC的委托。委托包含的权限可见表1以及表2。
展示批次详情 功能介绍 查询:批次详情,分页获取批次中的实例列表。 过滤条件:分页参数 URI GET /v1/job/script/orders/{execute_uuid}/batches/{batch_index} 表1 路径参数 参数 是否必选 参数类型 描述 batch_index
创建事件单 功能介绍 创建事件单 URI POST /v1/external/incident/create 请求参数 表1 请求Body参数 参数 是否必选 参数类型 描述 region 否 Array of strings 区域Code,如果自动拉起WarRoom则为必填,现在只支持1个
参数管理的页面权限? 权限设计 访问参数列表页:需要list权限: coc:parameter:list 获取参数详情:需要get权限:coc:parameter:get 删除参数:需要操作类权限:coc:parameter:delete 创建参数:需要操作类权限:coc:parameter:create
全旅程混沌工程方案 实践场景 某电商企业的新应用已经部署生产环境,计划正式启动接入和引流,其传统运维模式日常运维工作以被动救火为主,缺乏主动运维理念和工具能力;应用上线前无有效途径识别可用性问题,上线后可用性现状无法精确掌握,运维团队缺少故障应急能力和实战经验;希望通过混沌演练对
展示工单列表 功能介绍 查询作业工单列表,分页查询 过滤:创建时间开始,创建时间结束、创建人 返回:id、脚本名称、区域、创建人、创建时间、结束时间、总耗时、状态 URI GET /v1/job/script/orders 表1 Query参数 参数 是否必选 参数类型 描述 limit
概述 随着传统IT基础设施运维向云服务运维方式的转变,传统的运维手段面临服务间调用复杂、应用迭代速度快、海量运维对象、复杂系统非线性等挑战。业务的停机都会给公司带来巨大的经济损失和声誉影响。 在运维过程中引入混沌工程,通过定期进行演练的方式,可以在现网问题发生前识别系统的薄弱点(
故障模式 故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。 操作场景