云服务器内容精选

  • 前提条件 开通组织服务,请参见开通组织服务。 图1 开通组织服务 只有企业中心的企业主账号的权限才能创建组织,非企业账号不支持使用Organizations。 企业中心创建组织后,需要在Organizations重新授权,即可访问组织所有功能。 组织开通之后,跳转到组织管理页面,按照以下步骤创建组织: 1. 组织管理员需要创建一个组织,一个账号只能有一个组织; 2. 成员账号看不到除了控制面板外的东西; 3. 成员账号也必须是企业级账号; 授权COC为可信服务,请参见授权为可信服务。 图2 授权为可信服务 该账号为管理员或者委托管理员,如果不是请参照添加委托管理员章节的内容。 图3 添加委托管理员
  • 跨账号管理概述 云运维中心服务具备安全可靠的跨账号数据汇聚和资源运维能力,如果您的账号由组织管理,您可以在云运维中心对组织内所有成员账号进行统一的资源管理、自动化运维以及运维 态势感知 ,而无需逐个登录到成员账号。 通过COC对组织成员账号进行跨账号管理需要执行以下操作(以A账号管理B账号为例): 如果A账号是组织管理员,则跳过此步骤。如果A账号不是组织管理员,则由组织管理员将A账号添加为委托管理员,相关操作请参见添加委托管理员。 管理员可以添加或者取消成员的委托管理员权限,组织成员架构变动时需要1-2分钟后刷新页面才能生效。 由组织管理员或委托管理员邀请B账号加入组织,相关操作请参见邀请账号加入组织。 B账号加入组织后,登录A账号在COC服务“运维态势感知”、”资源管理”、”作业管理”页面可对B账号进行跨账号运维管理。 有关组织的详细说明请参见《组织用户指南》。 为了请求B账号下的数据资产信息,COC会自动在B账号中创建服务关联委托: 该委托是云服务委托,“委托权限”为“COCAssumeServiceLinkedAgencyPolicy”,“委托名称”为“ServiceLinkedAgencyForCOC”。 删除B账号时,COC会自动删除B账号内的服务关联委托。 父主题: 跨账号管理
  • 操作场景 云运维中心(Cloud Operations Center,简称COC)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。云运维中心的混沌演练功能支持用户配置演练模板、攻击模板,基于模板对物理机、虚拟机或CCE容器等进行故障演练。支持故障模式管理功能。您可以通过该功能对目标实例进行故障演练。 本章节介绍如何通过云运维中心操作一台弹性 云服务器ECS 进行CPU使用率加压的故障演练。
  • 操作流程 操作步骤 说明 准备工作 注册华为账号 并实名认证,开通云运维中心。 步骤一:同步资源 获取当前用户所属的所有Region下资源数据并同步至云运维中心。 步骤二:创建应用 管理应用与云资源的关系,并为后续资源的监控、自动化运维等,提供统一、及时的资源环境管理服务。 步骤三:创建演练任务 针对资源预设演练方案,支持多攻击任务自由编排的故障注入组合。 步骤四:启动演练 按照已经创建的演练任务,自动化的故障注入。
  • 创建 IAM 用户 IAM用户由账号创建并管理,可以确保账号及资源的安全性,有关IAM的详细介绍请参见IAM用户。此处介绍如何创建一个具有COC使用权限的IAM用户。若您不需要使用IAM用户,可以略过此部分内容。 访问华为云,使用账号和密码登录管理控制台。 在“控制台”页面,鼠标悬浮至右上方登录的用户名,在下拉列表中选择“ 统一身份认证 ”。 图1 统一身份认证 创建用户组并授权。 在左侧导航栏中选择“用户组”,在“用户组”页面,单击“创建用户组”,在弹出的“创建用户组”页面填写用户组名称和描述信息,完成用户组创建。 图2 创建用户组 用户组创建成功后,单击用户组“操作”列的“授权”,进入用户组选择策略页面,在右上角搜索框中按关键字“COC”搜索策略,勾选需要授予用户组的权限。COC权限说明参见权限管理。 图3 选择策略 COC FullAccess策略中包含的权限较大,请慎重添加。 如只需给用户授权部分COC功能,可创建自定义策略使用细粒度授权。 策略配置完成后,在设置最小授权范围页面中,选择授权范围方案,单击右下角的“确定”完成授权。 图4 设置最小授权范围 创建用户并加入用户组 创建用户时选择步骤3创建的具有COC权限的用户组。
  • 人员管理概述 人员管理为云运维中心提供了统一的人员数据管理。您可以在人员管理页面管理当前租户下的用户,人员管理中的用户从 IAM 同步,人员管理页面的数据作为云运维中心的用户基础数据,供创建待办、定时运维、通知管理、事件中心等多个功能模块使用。 人员管理页面可以手动选择需要的用户进行编辑、删除、请求订阅。 对已添加的用户在编辑时,若填写了手机号、邮箱、企业微信、钉钉、飞书等通讯方式,系统后台会为其创建对应的订阅方式,以便于满足后续 消息通知 的需要。 在人员管理页面可通过用户信息字段颜色区分当前是否存在订阅,灰色:用户未订阅或订阅但未确认订阅;黑色:用户已订阅且已确认订阅。 父主题: 人员管理
  • 概述 随着传统IT基础设施运维向云服务运维方式的转变,传统的运维手段面临服务间调用复杂、应用迭代速度快、海量运维对象、复杂系统非线性等挑战。业务的停机都会给公司带来巨大的经济损失和声誉影响。 在运维过程中引入混沌工程,通过定期进行演的方式,可以在现网问题发生前识别系统的薄弱点(软件Bug、方案设计不足之处、故障恢复流程卡点等),及早发现系统可用性的问题进行解决,持续提升应用韧性,建立运维信心。对于无法避免的场景(硬件故障、服务器异常下电、网络设备单板故障等)通过提前制定快速恢复应急预案进行应对。 COC混沌演练为用户提供一站式的自动化演练能力,覆盖从风险识别、应急预案管理、故障注入到复盘改进的端到端演练流程。承载华为云SRE在混沌演练上多年的最佳实践,使客户能对云上应用主动地进行风险识别、消减和风险验证,持续提升云应用的韧性。 父主题: 混沌演练
  • 问题流程 问题被创建后状态为“未受理”,未受理状态可对问题单受理、驳回或转发责任人。 问题受理后状态为“定位出方案中”,定位出方案中状态可对问题单填写问题定位结果信息、转发责任人、升降级和挂起。 问题单挂起后需要创建单人审核,审批通过后状态为“挂起”,挂起后问题单可手动解除挂起或到达设定的解除挂起时间自动解除挂起。 问题填写定位结果时,若选择需要变更,问题单状态为“待现网实施”,待现网实施页面需要关联变更单,变更单有回填结果,才能流转至下个步骤。 无需变更的问题或需要变更的问题已有变更结果,问题状态为“待验证”,创建人确认问题是否解决或未解决,未解决可进行驳回。 图1 问题管理操作流程 父主题: 问题管理
  • 自动化执行参数示例说明 参数值、Region ID、和目标实例填写格式为${},需要通过该表达式解析对应的值,相关示例如下: 参考示例: 告警信息如下: { "alarmId": "al1696664837170EWbvx24kW", "alarmName": "alarm-4z39coctest1007", ...... "URL": "https://console.ulanqab.huawei.com/ces/?region=cn-north-7#/alarms/detail?alarmId=al16849986549022X5Vp4pxr", "additional": { "dimension": "instance_id:29d99a09-2d15-4ced-8723-6e94ae1c1472", ...... }, ...... } 1. 如果要获取当前告警信息里面的alarmId的值,表达式写成如下形式: ${currentAlarm.alarmId} 2. 如果要从additional.dimension字符串里面获取instance_id的uuid,表达式写成如下形式: ${string.substring(currentAlarm.additional.dimension, string.indexOf(currentAlarm.additional.dimension, 'instance_id:') + 12)} 或者 ${string.substring(currentAlarm.additional.dimension, 12)} 3. 如果要从URL字符串里面获取cn-north-7这个region ID,表达式写成如下形式: ${string.substring(currentAlarm.URL, string.indexOf(currentAlarm.URL, 'region=') + 7, string.indexOf(currentAlarm.URL, '#/alarms'))} 表达式里面的"currentAlarm."是个固定前缀,意思是从当前告警的数据里面获取。
  • 事件流程 事件被创建后状态为“未受理”状态,未受理状态下可进行“转发”、“驳回”、“受理”等操作。 事件单被驳回后为“被驳回”状态,创建人可关闭事件或更新事件信息后重新提交。 事件单被受理后为“已受理”状态,已受理状态下可进行“事件处理”、“升降级”、“添加备注”、“启动warroom”等操作。 事件单被处理后,进入“已解决待验证”状态,已解决待验证状态下可进行“验证”操作,验证通过后事件单进入“已完成”状态,验证不通过后,重新进入“已受理”状态。 若需要增加事件级暂停功能,可参考基础配置-事件流程 图1 事件流程图 父主题: 事件管理
  • 获取账号密码 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“帐号管理”,进入“帐号管理”页面。 选择“帐号管理”页签,可通过资源视角和应用视角来管理主机。资源视角针对购买的所有主机实例,应用视角针对购买的并已绑定应用的主机。 图1 帐号管理概览 若用户只想托管(只保存作用,不改密)主机帐号密码,可通过“导入帐号”的形式,下载Excel模板填写资源相关信息,确认信息无误后上传。 图2 导入托管帐号 1、导入形式的E CS 资源帐号密码不参与纳管改密,若想对导入的帐号进行自动纳管,可以编辑全局基线或者创建帐号基线来添加对应帐号,则系统会对这些主机帐号密码进行立即纳管。 2、导入形式的DCS、RDS和DMS资源不参与纳管改密,帐号密码无法完成自动纳管改密。 若用户在OS上新增了主机帐号,在帐号管理页面勾选对应主机后,可通过“同步帐号”按钮一键同步新增的OS帐号。注意:若想新增的帐号参与纳管改密,还需在帐号基线中配置该帐号。 图3 同步OS帐号 当前帐号管理只支持单个主机的帐号密码查询,成功“获取帐号密码”的前提是主机帐号“改密状态”为“成功”或“改密失败原因”为“导入的帐号不参与改密”,可在“操作”列单击“查看帐号密码”确认资源改密状态。若“改密状态”为“失败”,需要先根据反馈的改密失败原因进行相关处理。 ECS主机改密条件: 1、主机资源状态为“运行中” 2、主机的UniAgent状态为“运行中” 3、主机OS上的帐号与所绑定的帐号基线中的帐号一致 增量的ECS主机改密条件: 1、改密策略已开启 已纳管的主机定期改密条件: 1、已绑定改密任务 图4 主机改密详情 用户可在资源视角/应用视角下通过条件搜索需要提权的资源,在“操作”列单击“查看帐号密码”后“获取帐号密码”。 图5 获取帐号密码 若资源视角下,主机改密详情无数据,优先确认主机是否挂组件。若主机已挂组件,请先确认是否已绑定组件基线或者组件维度的自动纳管策略为开启状态;若主机未挂组件,请先确认全局维度的自动纳管策略是否为开启状态。
  • 配置改密区域 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“帐号管理”,进入“帐号管理”页面。 选择“帐号改密”页签下“改密任务”页签,配置需要开启定期改密的区域。单击“选择区域”,勾选需要配置的区域至右选框后,单击“确定”。配置好之后可在“操作”列单击“查看任务详情”查看配置区域的改密任务,也可根据业务需求进行删除。 图1 配置改密任务 至此全部配置工作完成,可至“帐号管理”页签“查询帐号密码”。
  • 开启改密策略 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“帐号管理”,进入“帐号管理”页面。 选择“帐号改密”页签下“改密策略”页签,根据业务需要,进行纳管策略设置,来确保新增的主机实例也能被自动纳管。 图1 开启改密策略 未绑定组件的增量主机实例实现自动纳管,打开“全局维度”按钮即可;已绑定组件的增量主机实例实现自动纳管,点击“组件维度”页签下“选择组件”按钮,通过搜索应用或组件名称,“确定”提交即可。 图2 选择组件
  • 配置密钥 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“帐号管理”,进入“帐号管理”页面。 在页面右上角点击“密钥管理”按钮,或者通过“帐号管理流程引导”标签下方的“配置密钥”下“立即配置”按钮。 图1 配置密钥 进入“密钥管理”页面,单击“绑定密钥”,右滑出现选择密钥页面,选择需要绑定的密钥。若当前无可用密钥,单击“新建密钥”,跳转DEW服务创建密钥,新建后刷新表格即可选择。单击“确定”。 图2 绑定密钥 在“确认绑定”弹框中,提示绑定的密钥一经使用则不支持更新密钥,单击“确认”。 图3 确认绑定提示 确认绑定风险后,则密钥创建和配置相关工作即完成,若有更新密钥的需求,单击“更新”。 图4 完成密钥绑定
  • 特殊字符含义 表2 Cron表达式特殊字符含义 字符 含义 示例 * 表示匹配域的任意值 在分这个域使用 *,即表示每分钟都会触发事件。 ? 表示匹配域的任意值,但只能用在日期和星期两个域,因为这两个域会相互影响。 要在每月的 20 号触发调度,不管每个月的 20 号是星期几,则只能使用如下写法:13 13 15 20 * ?。其中,因为日期域已经指定了 20 号,最后一位星期域只能用 ?,不能使用 *。如果最后一位使用 *,则表示不管星期几都会触发,与日期域的 20 号相斥,此时表达式不正确。 - 表示起止范围 在小时这个域使用 8-10,表示从 8时到 10 时每小时触发一次。 / 表示起始时间开始触发,然后每隔固定时间触发一次 在小时这个域中使用,“*/3”等同于“每3个小时”,即“0,3,6,9,12,15,18,21”小时触发。 L 表示最后,只能出现在日和星期两个域 在星期这个域使用 5L,意味着在最后的一个星期四触发。