云服务器内容精选

  • 人员管理概述 人员管理为云运维中心提供了统一的人员数据管理。您可以在人员管理页面管理当前租户下的用户,人员管理中的用户从 IAM 同步,人员管理页面的数据作为云运维中心的用户基础数据,供创建待办、定时运维、通知管理、事件中心等多个功能模块使用。 人员管理页面可以手动选择需要的用户进行编辑、删除、请求订阅。 对已添加的用户在编辑时,若填写了手机号、邮箱、企业微信、钉钉、飞书等通讯方式,系统后台会为其创建对应的订阅方式,以便于满足后续 消息通知 的需要。 在人员管理页面可通过用户信息字段颜色区分当前是否存在订阅,灰色:用户未订阅或订阅但未确认订阅;黑色:用户已订阅且已确认订阅。 父主题: 人员管理
  • 概述 随着传统IT基础设施运维向云服务运维方式的转变,传统的运维手段面临服务间调用复杂、应用迭代速度快、海量运维对象、复杂系统非线性等挑战。业务的停机都会给公司带来巨大的经济损失和声誉影响。 在运维过程中引入混沌工程,通过定期进行演练的方式,可以在现网问题发生前识别系统的薄弱点(软件Bug、方案设计不足之处、故障恢复流程卡点等),及早发现系统可用性的问题进行解决,持续提升应用韧性,建立运维信心。对于无法避免的场景(硬件故障、服务器异常下电、网络设备单板故障等)通过提前制定快速恢复应急预案进行应对。 COC混沌演练为用户提供一站式的自动化演练能力,覆盖从风险识别、应急预案管理、故障注入到复盘改进的端到端演练流程。承载华为云SRE在混沌演练上多年的最佳实践,使客户能对云上应用主动地进行风险识别、消减和风险验证,持续提升云应用的韧性。 父主题: 混沌演练
  • 问题流程 问题被创建后状态为“未受理”,未受理状态可对问题单受理、驳回或转发责任人。 问题受理后状态为“定位出方案中”,定位出方案中状态可对问题单填写问题定位结果信息、转发责任人、升降级和挂起。 问题单挂起后需要创建单人审核,审批通过后状态为“挂起”,挂起后问题单可手动解除挂起或到达设定的解除挂起时间自动解除挂起。 问题填写定位结果时,若选择需要变更,问题单状态为“待现网实施”,待现网实施页面需要关联变更单,变更单有回填结果,才能流转至下个步骤。 无需变更的问题或需要变更的问题已有变更结果,问题状态为“待验证”,创建人确认问题是否解决或未解决,未解决可进行驳回。 图1 问题管理操作流程 父主题: 问题管理
  • 自动化执行参数示例说明 参数值、Region ID、和目标实例填写格式为${},需要通过该表达式解析对应的值,相关示例如下: 参考示例: 告警信息如下: { "alarmId": "al1696664837170EWbvx24kW", "alarmName": "alarm-4z39coctest1007", ...... "URL": "https://console.ulanqab.huawei.com/ces/?region=cn-north-7#/alarms/detail?alarmId=al16849986549022X5Vp4pxr", "additional": { "dimension": "instance_id:29d99a09-2d15-4ced-8723-6e94ae1c1472", ...... }, ...... } 1. 如果要获取当前告警信息里面的alarmId的值,表达式写成如下形式: ${currentAlarm.alarmId} 2. 如果要从additional.dimension字符串里面获取instance_id的uuid,表达式写成如下形式: ${string.substring(currentAlarm.additional.dimension, string.indexOf(currentAlarm.additional.dimension, 'instance_id:') + 12)} 或者 ${string.substring(currentAlarm.additional.dimension, 12)} 3. 如果要从URL字符串里面获取cn-north-7这个region ID,表达式写成如下形式: ${string.substring(currentAlarm.URL, string.indexOf(currentAlarm.URL, 'region=') + 7, string.indexOf(currentAlarm.URL, '#/alarms'))} 表达式里面的"currentAlarm."是个固定前缀,意思是从当前告警的数据里面获取。
  • 事件流程 事件被创建后状态为“未受理”状态,未受理状态下可进行“转发”、“驳回”、“受理”等操作。 事件单被驳回后为“被驳回”状态,创建人可关闭事件或更新事件信息后重新提交。 事件单被受理后为“已受理”状态,已受理状态下可进行“事件处理”、“升降级”、“添加备注”、“启动warroom”等操作。 事件单被处理后,进入“已解决待验证”状态,已解决待验证状态下可进行“验证”操作,验证通过后事件单进入“已完成”状态,验证不通过后,重新进入“已受理”状态。 若需要增加事件级暂停功能,可参考基础配置-事件流程 图1 事件流程图 父主题: 事件管理
  • 获取账号密码 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“帐号管理”,进入“帐号管理”页面。 选择“帐号管理”页签,可通过资源视角和应用视角来管理主机。资源视角针对购买的所有主机实例,应用视角针对购买的并以绑定应用的主机。 图1 帐号管理概览 若用户只想托管(只保存作用,不改密)主机帐号密码,可通过“导入帐号”的形式,下载Excel模板填写资源相关信息,确认信息无误后上传。 图2 导入托管帐号 1、导入形式的E CS 资源帐号密码不参与纳管改密,若想对导入的帐号进行自动纳管,可以编辑全局基线或者创建帐号基线来添加对应帐号,则系统会对这些主机帐号密码进行立即纳管。 2、导入形式的DCS、RDS和DMS资源不参与纳管改密,帐号密码无法完成自动纳管改密。 若用户在OS上新增了主机帐号,在帐号管理页面勾选对应主机后,可通过“同步帐号”按钮一键同步新增的OS帐号。注意:若想新增的帐号参与纳管改密,还需在帐号基线中配置该帐号。 图3 同步OS帐号 当前帐号管理只支持单个主机的帐号密码查询,成功“获取帐号密码”的前提是主机帐号“改密状态”为“成功”或“改密失败原因”为“导入的帐号不参与改密”,可在“操作”列单击“查看帐号密码”确认资源改密状态。若“改密状态”为“失败”,需要先根据反馈的改密失败原因进行相关处理。 ECS主机改密条件: 1、主机资源状态为“运行中” 2、主机的UniAgent状态为“运行中” 3、主机OS上的帐号与所绑定的帐号基线中的帐号一致 增量的ECS主机改密条件: 1、改密策略已开启 已纳管的主机定期改密条件: 1、已绑定改密任务 图4 主机改密详情 用户可在资源视角/应用视角下通过条件搜索需要提权的资源,在“操作”列单击“查看帐号密码”后“获取帐号密码”。 图5 获取帐号密码 若资源视角下,主机改密详情无数据,优先确认主机是否挂组件。若主机已挂组件,请先确认是否已绑定组件基线或者组件维度的自动纳管策略为开启状态;若主机未挂组件,请先确认全局维度的自动纳管策略是否为开启状态。
  • 配置改密区域 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“帐号管理”,进入“帐号管理”页面。 选择“帐号改密”页签下“改密任务”页签,配置需要开启定期改密的区域。单击“选择区域”,勾选需要配置的区域至右选框后,单击“确定”。配置好之后可在“操作”列单击“查看任务详情”查看配置区域的改密任务,也可根据业务需求进行删除。 图1 配置改密任务 至此全部配置工作完成,可至“帐号管理”页签“查询帐号密码”。
  • 开启改密策略 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“帐号管理”,进入“帐号管理”页面。 选择“帐号改密”页签下“改密策略”页签,根据业务需要,进行纳管策略设置,来确保新增的主机实例也能被自动纳管。 图1 开启改密策略 未绑定组件的增量主机实例实现自动纳管,打开“全局维度”按钮即可;已绑定组件的增量主机实例实现自动纳管,点击“组件维度”页签下“选择组件”按钮,通过搜索应用或组件名称,“确定”提交即可。 图2 选择组件
  • 配置密钥 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“帐号管理”,进入“帐号管理”页面。 在页面右上角点击“密钥管理”按钮,或者通过“帐号管理流程引导”标签下方的“配置密钥”下“立即配置”按钮。 图1 配置密钥 进入“密钥管理”页面,单击“绑定密钥”,右滑出现选择密钥页面,选择需要绑定的秘钥。若当前无可用密钥,单击“新建密钥”,跳转DEW服务创建密钥,新建后刷新表格即可选择。单击“确定”。 图2 绑定密钥 在“确认绑定”弹框中,提示绑定的密钥一经使用则不支持更新密钥,单击“确认”。 图3 确认绑定提示 确认绑定风险后,则密钥创建和配置相关工作即完成,若有更新密钥的需求,单击“更新”。 图4 完成密钥绑定
  • 特殊字符含义 表2 Cron表达式特殊字符含义 字符 含义 示例 * 表示匹配域的任意值 在分这个域使用 *,即表示每分钟都会触发事件。 ? 表示匹配域的任意值,但只能用在日期和星期两个域,因为这两个域会相互影响。 要在每月的 20 号触发调度,不管每个月的 20 号是星期几,则只能使用如下写法:13 13 15 20 * ?。其中,因为日期域已经指定了 20 号,最后一位星期域只能用 ?,不能使用 *。如果最后一位使用 *,则表示不管星期几都会触发,与日期域的 20 号相斥,此时表达式不正确。 - 表示起止范围 在小时这个域使用 8-10,表示从 8时到 10 时每小时触发一次。 / 表示起始时间开始触发,然后每隔固定时间触发一次 在小时这个域中使用,“*/3”等同于“每3个小时”,即“0,3,6,9,12,15,18,21”小时触发。 L 表示最后,只能出现在日和星期两个域 在星期这个域使用 5L,意味着在最后的一个星期四触发。
  • 操作步骤 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“作业管理”,进入“作业管理”页面。 图1 作业管理页面 选择“自定义作业”页签,单击“创建作业”,进入“创建作业”页面。 图2 单击创建作业 填写作业基本信息,包含作业名称,企业项目,描述和标签。可按照标签管理中的步骤创建标签,填写完成后单击“下一步”。 图3 填写作业基本信息 选择作业模板,如果没有合适的模板,选择“自定义”,单击“下一步”。 图4 选择作业模板 进行作业编排,单击“添加任务”,选择基本信息,点击,选择“执行命令”。 图5 添加任务 填写任务名称,操作描述。 图6 添加基本信息 单击“输入”,按需选择commandType (命令类型) :SHELL、PYTHON或BAT。设置executeUser (命令执行用户)、timeout (命令执行超时时长(秒)) 、successRate (成功率阈值(%)) 、commandContent (命令内容) 和commandParams (命令入参) 。 图7 添加输入信息 单击“异常处理”,配置执行出现错误后的行为:终止整个作业或执行下一个步骤。 图8 添加异常处理信息 单击“确定”,完成当前原子动作的配置。
  • 操作步骤 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“作业管理”,进入“作业管理”页面。 图1 作业管理页面 选择“自定义作业”页签,单击“创建作业”,进入“创建作业”页面。 图2 单击创建作业 填写作业基本信息,包含作业名称,企业项目,描述和标签。可按照标签管理中的步骤创建标签,填写完成后单击“下一步”。 图3 填写作业基本信息 选择作业模板,如果没有合适的模板,选择“自定义”,单击“下一步”。 图4 选择作业模板 进行作业编排,单击“添加任务”,选择基本信息,点击,选择“等待API结果”。 图5 添加任务 填写任务名称,操作描述。 图6 添加基本信息 单击“输入”,按需选择service(产品短名)、apiName(api名称),如选择云数据库的ShowBackupPolicy(查询自动备份策略)OpenAPI,显示具体的OpenAPI定义。 填写“propertySelector (检查资源属性) ”,指定需要作为判定条件的响应字段。按需配置判断条件: stopRetryValues (终止任务等待及API重试标识) :终止当前原子动作等待的标识; desiredValues (期望匹配成功标识) :期望值,当propertySelector与当前值相同时,认为当前原子动作执行成功; notDesiredValues (期望非匹配成功标识) :期望非匹配值,当propertySelector与当前值相同时,认为当前原子动作执行失败。 图7 添加输入信息 单击“输出”,按需配置输出内容,如将接口响应的backup_policy作为String类型的参数,命名为outputValue。如无需要,则无需添加参数。 图8 添加输出信息 单击“异常处理”,配置执行出现错误后的行为:终止整个作业或执行下一个步骤。 图9 添加异常处理信息 单击“确定”,完成当前原子动作的配置。
  • 操作步骤 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“作业管理”,进入“作业管理”页面。 图1 作业管理页面 选择“自定义作业”页签,单击“创建作业”,进入“创建作业”页面。 图2 单击创建作业 填写作业基本信息,包含作业名称,企业项目,描述和标签。可按照标签管理中的步骤创建标签,填写完成后单击“下一步”。 图3 填写作业基本信息 选择作业模板,如果没有合适的模板,选择“自定义”,单击“下一步”。 图4 选择作业模板 进行作业编排,单击“添加任务”,选择基本信息,单击,选择“执行API”。 图5 添加任务 填写任务名称,操作描述。 图6 填写基本信息 单击“输入”,按需选择service(产品短名)、apiName(api名称),如选择云数据库的ListSlowLogsNew(查询数据库慢日志)OpenAPI,显示具体的OpenAPI定义。 填写所需OpenAPI参数内容。 图7 添加输入信息 单击“输出”,按需配置输出内容,如将接口响应的slow_log_list作为String类型的参数,命名为outputValue。如无需要,则无需添加参数。 图8 添加输出信息 单击“异常处理”,配置执行出现错误后的行为:终止整个作业或执行下一个步骤。 图9 添加异常处理 单击“确定”,完成当前原子动作的配置。
  • 操作步骤 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“作业管理”,进入“作业管理”页面。 图1 作业管理页面 在“作业管理”页面,选择“自定义作业”页签,选中需要执行的作业,单击“执行”。 图2 选择需要执行的作业 选择作业版本号,并检查作业步骤是否符合预期。 图3 检查作业步骤 选择执行类型。 图4 "执行类型" 分为两种:单账号执行/跨账号跨区域执行 选择填入“IAM权限委托”,IAM权限委托将用于runbook执行过程中,通过委托切换对应身份,然后执行作业。 图5 填入IAM权限委托 若选择的是跨账号跨区域执行类型,则需要填入对应的执行规则。 图6 注意:使用该功能,需要提前加入到组织中并提前配置好委托权限,并填入对应的委托名称 字段说明: 执行账号:即租户账号名,可以通过我的凭证页面查看。 图7 我的凭证页面-账号名 执行区域:执行的目标对象所在的区域 委托名称:IAM中委托对象的名称 图8 IAM页面-委托-获取本次执行的委托的名称 项目ID:IAM中的项目概念,执行的目标对象所在的项目的ID 图9 IAM页面-项目-本次执行的对象的项目-查看 图10 获取对象项目的ID 填写执行基本信息,包含执行描述和标签。可按照标签管理中的步骤创建标签。 图11 填写执行基本信息 选择作业在目标实例的执行模式,分为“所有步骤一致”和“每个步骤独立”两种。 表1 目标实例模式说明 目标 说明 所有步骤一致 本作业涉及的所有步骤将按顺序在目标实例执行 每个步骤独立 自定义配置,配置时可选择指定步骤仅在指定目标实例执行 图12 选择所有步骤一致 图13 选择每个步骤独立 单击“+添加实例”,选择待执行实例的区域,根据实例名称、UniAgent状态等条件筛选并选中目标实例,单击“确定”。 图14 选择目标实例 选择作业执行的“分批策略”。 自动分批:用户选择的待执行机器,会根据默认规则,分成多批。 手动分批:用户可以根据自身需要,将待执行的机器,分成若干批,控制机器所在的批次。 不分批:用户所有待执行的机器会全部在同一批次。 图15 选择分批策略 单击“提交”,执行自定义作业,将跳转到作业工单详情页面。在工单详情页面查看作业和各批次的执行情况。 单击“强制结束”,将结束本次作业的所有执行任务。 单击“结束所有批次”,将结束当前步骤所有批次的执行任务。 图16 作业工单详情
  • 操作步骤 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“作业管理”,进入“作业管理”页面。 图1 作业管理页面 选择“自定义作业”页签,单击“创建作业”,进入“创建作业”页面。 图2 单击创建作业 填写作业基本信息,包含作业名称,企业项目,描述和标签。可按照标签管理中的步骤创建标签,填写完成后单击“下一步”。 图3 填写作业基本信息 选择作业模板,如果没有合适的模板,选择“自定义”,单击“下一步”。 图4 选择作业模板 进行作业编排,作业编排由全局参数、作业步骤组成。 图5 作业编排 单击“+添加参数”,添加全局参数,配置后单击“完成”。 全局参数支持自定义、从参数仓库获取两种。选择自定义时需要自行填写参数名称、默认值和参数描述;从参数仓库获取时需要选择参数所在区域、参数名称和参数联动模式。 图6 选择自定义并添加全局参数 图7 从参数仓库获取并添加全局参数 表1 参数联动模式说明表 参数联动模式 说明 所有环境使用当前参数值 作业执行时使用该参数,参数值为创建作业添加参数时该参数基本信息中显示的参数值 使用对应环境最新参数值 作业执行时使用该参数,参数值为实时从参数仓库中获取的最新参数值 单击,在步骤间添加新步骤。 图8 新增步骤 单击步骤名称或者,可以修改步骤名称。 图9 修改步骤名称 对于已添加的作业步骤,单击,删除不需要的步骤。 图10 删除步骤 单击“+添加任务”,为步骤添加任务。任务添加完成后,单击“完成”。所有任务添加完成后,单击“确定”。 图11 添加任务 单击“+操作类型”,设置当前任务的操作类型,操作类型分为云服务API、控制、自定义脚本三种。 云服务API:包含ECS相关操作原子、执行API和等待API调用结果。ECS操作详见:ECS操作。 控制:包含审批、暂停和睡眠。 自定义脚本:支持选择自定义脚本类型和执行命令。自定义脚本创建后,会自动注册一条自定义原子记录。 图12 选择操作类型 根据选择的操作类型,填写名称、操作描述等基本信息,参数信息和异常处理策略,填写完成后单击“完成”。 图13 填写基本信息 图14 填写输入 图15 填写异常处理 作业编排完成后,根据操作风险,确定作业的风险等级,选择“审核人配置”和“通知渠道”后,单击“提交”。 设置作业入库人工审核策略,风险等级为“高”的作业默认开启人工审批。 在“审核人配置”行选择“排班”,则指定当前排班中的用户为审批人;选择“个人”,则指定某些用户为审批人。 选择“通知渠道”,审核请求将通过指定渠道通知到审核人。 图16 更多配置