华为云用户手册

  • 业务报表开发流程 使用业务报表进行业务监控的流程如图1所示。 图1 业务报表开发流程图 服务数据分析岗位权限或服务运维岗位权限人员开发业务报表 新增业务报表数据源:首次使用数据源进行报表开发,需要先新增数据源后才能使用。 新增业务报表页面:业务报表以页面来呈现,开发报表需要先新增报表页面。如需对页面进行管理,请参见在监控服务管理业务报表页面。 开发业务报表:为报表新增数据图表,以图表来体现业务数据的动态变化。 基于数仓配置图表:新增warehouse类型数据源后,可以基于数仓中创建的指标或视图配置图表。 基于SQL配置图表:新增其他类型数据源后,可以基于SQL配置图表。 自有服务所有人员可以查看已开发业务报表 查看业务报表:查看已开发业务报表进行业务监控。
  • 录入企业项目 进入AppStage运维中心。 将鼠标悬停在右上角的账号,选择下拉列表中的“服务环境配置”,选择左侧导航栏的“服务关联”。 在项目配置区域,单击“新增”。 新增项目配置,具体参数如表1所示。 表1 项目配置参数 名称 说明 部门 选择已录入的部门。 产品 选择已录入的产品。 服务 选择已录入的服务。 华为公有云账号名 选择用户的华为账号名。 类型 关联项目:关联已有的公有云EPS。 关联且新增项目:在公有云EPS创建一个新项目,同时进行关联。 企业项目名称 关联项目时,选择已有的公有云EPS。 关联且新增时,填写创建的企业项目名称。 单击“确定”。
  • 步骤一:创建环境 进入AppStage运维中心。 将鼠标悬停在右上角的账号,选择下拉列表中的“服务环境配置”,选择左侧导航栏的“环境管理”。 单击“创建”,配置环境参数,具体参数如表1所示。 表1 创建环境参数 参数 说明 名称 填写环境名称,名称全局唯一,只能包含小写字母、数字以及下划线,不能以下划线开头。 用途 选择环境的用途。可选用途包括开发、测试、生产、安全和性能。 描述 环境的描述信息。 单击“确定”。
  • 更多操作 您还可以进行以下操作。 表2 相关操作 操作名称 操作步骤 管理扫描规则 VMS默认扫描华为公有云账号下的所有资源,可以禁用或者删除对应账号的扫描规则。 在“未纳管主机”页面,单击列表上方的“扫描规则”。 单击对应账号后的“编辑”,禁用该账号扫描规则;或者单击“删除”,删除该账号规则。 查看未纳管主机详情 在“未纳管主机”页面可以单击资源所在行后“详情”列的内容,查看资源部署参数详情。 导出未纳管主机 在“未纳管主机”页面,单击列表上方的“导出”,即可导出所有未纳管主机。 在“我的导出”页面,单击文件名下载并查看导出信息。 升级OpsAgent 在未纳管主机列表,勾选待升级OpsAgent的主机。 单击列表上方的“升级OpsAgent”。 选择需要升级的OpsAgent的版本。 单击“确定”。 卸载OpsAgent 在未纳管主机列表,勾选待卸载OpsAgent的主机。 单击列表上方的“卸载OpsAgent”。 单击“确定”。
  • 步骤二:安装OpsAgent 在“未纳管主机”页面,单击“部署OpsAgent”。 安装方式选择“远程安装”或“手动安装”。 手动安装:首次安装OpsAgent时,必须使用手动安装方式。 填写基本信息,OpsAgent基本信息参数说明如表1所示。 表1 OpsAgent基本信息参数说明 参数名称 参数说明 租户账号 选择租户账号,为租户VPC下的主机安装OpsAgent。 归属Region 选择租户VPC所属的Region。 OpsAgent版本 选择需要安装的OpsAgent的版本号。 VPC 选择 虚拟私有云VPC ,为该VPC下的主机安装OpsAgent。 说明: 可选VPC为已纳管VPC,如无可选VPC,请完成将VPC纳管至运维中心ENS打通网络。 接入方式 当前支持“直接接入(内网)”的接入方式,为华为云主机接入安装OpsAgent。 单击CURL命令或WGET命令后的,复制安装命令。 使用root账号远程登录主机后,执行安装命令安装OpsAgent。 安装完成后,未纳管主机列表中,该主机的OpsAgent状态为“在线”。 远程安装:选择虚拟私有云下已经安装了OpsAgent的主机作为安装机,安装机将作为中间桥梁安装OpsAgent到同虚拟私有云下的其他主机。 填写基本信息,OpsAgent基本信息参数说明如表1所示。 选择安装机,选择一台已安装OpsAgent的主机作为安装机。 添加主机,单击需要安装OpsAgent的主机所在行“操作”列的“编辑”,输入主机root密码后单击“确定”,然后在列表中勾选该主机。 单击“确定”,安装机将作为执行机为主机安装OpsAgent。 在“未纳管主机”页面,可以通过OpsAgent状态判断主机OpsAgent是否安装成功。 如果主机的OpsAgent状态为“在线”,表示已安装成功。 如果主机的OpsAgent状态为“失败”,表示未安装成功,可以在“OpsAgent任务”页面,查看安装任务日志。
  • 操作须知 将主机纳管至VMS,需要完成如下操作: 步骤一:刷新未纳管主机:首先需要刷新未纳管主机,将华为云其他主机同步至未纳管主机列表中。 步骤二:安装OpsAgent:纳管前需要为主机安装OpsAgent。 步骤三:分配主机:纳管主机需要将主机分配到对应的服务及环境下。 主机分配当天密码管理定时任务会自动修改主机账号的密码,密码有效期为90天,到期自动修改。如果不想密码被修改,需要在纳管主机前配置密码白名单规则。如果没有配置密码白名单规则,密码管理任务会检查密码有效期,并在密码过期前20天修改密码。
  • 使用限制 绑定监控模板进行主机监控,支持的主机的操作系统如表1所示,其余类型的主机无法绑定监控插件。 表1 监控服务支持的主机操作系统 操作系统 系统版本 EulerOS EulerOS2.5、EulerOS2.9 CentOS CentOS 7.2、CentOS 7.6、CentOS 7.8、CentOS 7.9、CentOS 8.2 Ubuntu Ubuntu 18.04、Ubuntu 20.04、Ubuntu 22.04 Huawei Cloud EulerOS Huawei Cloud EulerOS 2.0 SUSE SUSE11、SUSE12、SUSE15、OpenSUSE 15.0
  • 使用限制 绑定监控模板进行主机监控,支持的主机的操作系统如表1所示,其余类型的主机无法绑定监控插件。 表1 监控服务支持的主机操作系统 操作系统 系统版本 EulerOS EulerOS2.5、EulerOS2.9 CentOS CentOS 7.2、CentOS 7.6、CentOS 7.8、CentOS 7.9、CentOS 8.2 Ubuntu Ubuntu 18.04、Ubuntu 20.04、Ubuntu 22.04 Huawei Cloud EulerOS Huawei Cloud EulerOS 2.0 SUSE SUSE11、SUSE12、SUSE15、OpenSUSE 15.0
  • 采集Linux主机监控指标操作流程 采集Linux主机监控指标操作流程如图1所示。 图1 操作流程 创建监控模板:监控服务提供_OS_DEFAULT监控模板,同时可以创建其他监控模板,并用户可以在模板内添加需要使用的插件。 绑定监控模板:为主机绑定在模板管理中创建的监控模板,系统会根据插件采集主机的各项监控指标。可以按主机绑定监控模板,也可以对主机进行分组,按分组绑定监控模板。 查看虚机报表:监控指标数据采集后,可以在虚机报表中查看。
  • 更多操作 您还可以对WarRoom通知进行以下操作。 表2 WarRoom管理 操作名称 操作步骤 查看WarRoom通知 在WarRoom列表,单击待查看WarRoom通知所在行“操作”列的“查看”。 克隆WarRoom通知 在WarRoom列表,单击待克隆WarRoom通知所在行“操作”列的“克隆”。 再次发送WarRoom通知 在WarRoom列表,单击待发送WarRoom通知所在行“操作”列的“再次发送”。 查看WarRoom通知日志 在WarRoom列表,单击待查看日志的WarRoom通知所在行“操作”列的“日志”。
  • 更多操作 您还可以对已创建的日志清理作业进行以下操作。 表2 相关操作 操作名称 操作步骤 停用日志清理作业 在日志清理作业列表中,单击日志清理作业所在行“启用”列的,当变为时,表示已停用该作业。 启用日志清理作业 在日志清理作业列表中,单击日志清理作业所在行“启用”列的,当变为时,表示已启用该作业。 查看执行历史 在定时作业列表中,单击日志清理作业所在行“操作”列的“执行历史”,进入“作业清单”页面查看执行历史。 编辑日志清理作业 在定时作业列表中,单击日志清理作业所在行“操作”列的“编辑”。 编辑日志清理作业信息,单击“保存”。 说明: 启用中的作业不支持编辑,要停用作业后才能编辑。 删除日志清理作业 在日志清理作业列表中,单击日志清理作业所在行“操作”列的“删除”。 单击“确定”。 说明: 启用中的作业不支持删除,要停用作业后才能删除。
  • 更多操作 您还可以对已创建的定时作业进行以下操作。 表2 相关操作 操作名称 操作步骤 停用定时作业 在定时作业列表中,单击定时作业所在行“启用”列的,当变为时,表示已停用该作业。 启用定时作业 在定时作业列表中,单击定时作业所在行“启用”列的,当变为时,表示已启用该作业。 查看执行历史 在定时作业列表中,单击定时作业所在行“操作”列的“执行历史”,进入“作业清单”页面查看执行历史。 编辑定时作业 在定时作业列表中,单击定时作业所在行“操作”列的“编辑”。 编辑定时作业信息,单击“保存”。 说明: 启用中的作业不支持编辑,要停用作业后才能编辑。 删除定时作业 在定时作业列表中,单击定时作业所在行“操作”列的“删除”。 单击“确定”。 说明: 启用中的作业不支持删除,要停用作业后才能删除。
  • 更多操作 规则创建后,您还可以对规则进行以下操作。 表2 相关操作 操作名称 操作步骤 启用规则 在规则列表,单击待启用的规则所在行“启用状态”列的,当显示为时,表示启用成功。 禁用规则 在规则列表,单击待禁用的规则所在行“启用状态”列的,当显示为时,表示禁用成功。 规则禁用后将不可用。 编辑规则 在规则列表,单击待编辑规则所在行“操作”列的“编辑”。 删除规则 在规则列表,单击待删除规则所在行“操作”列的“删除”。
  • 更多操作 自定义巡检项创建后,您还可以对巡检项进行以下操作。 表4 相关操作 操作名称 操作步骤 查看巡检项详情 在自定义巡检项列表,单击待查看详情的巡检项所在行“操作”列的“详情”。 启用巡检项 在自定义巡检项列表,单击待启用的巡检项所在行“启用状态”列的,当状态显示为“启用”,表示启用成功。 禁用巡检项 在自定义巡检项列表,单击待禁用的巡检项所在行“启用状态”列的,当状态显示为“未启用”,表示禁用成功。 巡检项禁用后将不可用,创建巡检场景时不能选择到已禁用的巡检项。 编辑巡检项 在自定义巡检项列表,单击待编辑巡检项所在行“操作”列的“编辑”。 删除巡检项 在自定义巡检项列表,单击待删除巡检项所在行“操作”列的“删除”。
  • 日志接入场景 表1 日志接入场景说明 场景 说明 日志接入方式 虚拟机日志 日志存储在虚拟机下的文件路径中。 虚拟机日志接入 容器hostPath日志 主机文件系统上的文件或目录挂载到容器上,使用主机文件系统存储容器日志。 容器日志接入 容器标准输出日志 标准输出是Kubernetes社区推荐的日志输出方式。 虚拟机日志接入同时开启软连接 容器共享存储日志 容器日志挂载在共享存储上。 容器归属的虚拟机没有挂载此共享存储,则无法采集对应的容器日志,需要将共享存储挂载在虚拟机上。 将共享存储挂载在虚拟机上,然后使用虚拟机日志接入方式
  • 更多操作 告警标记规则创建后,您还可以对规则进行以下操作。 表2 相关操作 操作名称 操作步骤 修改告警标记规则 在告警标记规则列表,单击待修改规则所在行“操作”列的“修改”。 修改配置信息,单击“确定”。 克隆告警标记规则 在告警标记规则列表,单击待克隆规则所在行“操作”列的“克隆”。 修改配置信息,单击“确定”。 删除告警标记规则 在告警标记规则列表,单击待删除规则所在行“操作”列的“删除”。 单击“确定”。
  • 更多操作 告警升级规则创建后,您还可以对规则进行以下操作。 表2 相关操作 操作名称 操作步骤 修改告警升级规则 在告警升级规则列表,单击待修改规则所在行“操作”列的“修改”。 修改配置信息,单击“确定”。 克隆告警升级规则 在告警升级规则列表,单击待克隆规则所在行“操作”列的“克隆”。 修改配置信息,单击“确定”。 删除告警升级规则 在告警升级规则列表,单击待删除规则所在行“操作”列的“删除”。 单击“确定”。
  • 更多操作 告警屏蔽规则创建后,您还可以对规则进行以下操作。 表2 相关操作 操作名称 操作步骤 修改告警屏蔽规则 在生效规则列表,单击待修改规则所在行“操作”列的“修改”。 修改配置信息,单击“确定”。 克隆告警屏蔽规则 在生效规则列表,单击待克隆规则所在行“操作”列的“克隆”。 修改配置信息,单击“确定”。 修改已失效告警屏蔽规则 在失效规则列表,单击待修改规则所在行“操作”列的“修改”。 修改配置信息,单击“确定”。 克隆已失效告警屏蔽规则 在失效规则列表,单击待克隆规则所在行“操作”列的“克隆”。 修改配置信息,单击“确定”。
  • 告警类型说明 告警在列表中总共有五种状态,实际上告警本身只有告警中和已解决两种状态,根据这两种状态在系统中不同的标记又细分为五种状态,具体告警类型如表2所示。 表2 告警类型说明 告警类型 告警说明 当前告警 告警进入系统后如果没有被屏蔽规则屏蔽就会进入该页签,表示当前仍然是告警中状态且未被清除和屏蔽的告警。 屏蔽告警 告警进入系统后被设置的屏蔽规则自动屏蔽或者人为在界面上手动单击屏蔽的告警。屏蔽的告警分为两种,一种是有具体屏蔽时间的,到了屏蔽时间结束后会作为一条新的告警再次出现在当前告警的列表中,一种是没有屏蔽时间的,将会被永久屏蔽。 历史告警 历史告警都是已解决的告警,让告警进入已解决的状态的方式有两种,一种是上报的告警已解决,这条告警就会被清除进入历史告警,或者是在界面上直接清除告警也会进入历史告警。 未确认已恢复告警 系统接收到已解决或自动清除的告警,非界面操作影响的告警。 归档告警 历史告警中,告警级别在严重和紧急的告警且是已解决状态的,每个小时会被定时任务扫描到转移至归档告警。
  • 查询告警参数说明 可以用不同参数对告警进行查询,参数说明如表3所示。 表3 查询告警参数说明 告警参数 参数说明 应用/服务 告警所属的自有服务,不选则默认展示用户拥有权限下的所有告警。 告警级别 告警上报时所带的level字段。 显示模式 显示模式分为三种,告警收敛,原始告警和仅收敛告警。 告警收敛:展示未参与收敛的告警与收敛的告警是默认的显示模式,当告警被收敛后,收敛告警的正文中会统计当前收敛的子告警的状态。单击告警收敛后可以操作和查看具体子告警。 原始告警:原始告警展示除了收敛告警外的所有告警,包括已经被收敛了的原始告警也会展示。 仅收敛告警:仅展示已经被收敛了的告警。 状态 支持对未确认、已确认、已通知、处理中和处理完成的告警进行查询。 语音呼叫状态 告警当前的语音呼叫的状态。 告警类型 上报的告警会显示类型信息,可根据类型筛选查看告警。 入库时间 告警进入系统的时间。 区域 告警涉及的区域。 告警单发 选择是否查看属于告警单发的告警。 无处理人 选择无处理人的告警。
  • 认识监控服务概览页 监控服务概览页如图1所示,展示近7天各级别告警数量、告警列表及关键事件列表等信息。 图1 监控服务概览 告警 - 近7天:展示近7天各级别告警数量。 告警列表 - 近7天:展示近7天严重和紧急级别的告警,可单击“更多”查看对应告警详情。 关键事件列表 - 近7天:展示近7天关键事件,可单击“更多”跳转至“事件列表”页面查看事件详情。 关键体验指标/黄金指标:展示关键体验指标/黄金指标,可以设置查询时间及查询粒度。 XXXX标准指标:展示各标准指标的监控数据,如负载均衡(SLB)标准指标、数据库治理(WiseDBA)标准指标、主机管理服务(VMS)标准指标等,如图2所示。 图2 VMS指标 父主题: 使用监控服务进行资源及业务监控
  • 更多操作 变更电子流创建后,您还可以对电子流进行以下操作。 表2 相关操作 操作名称 操作步骤 撤回变更电子流 在我的申请列表,单击待撤回变更电子流所在行“操作”列的。 撤回后记录依然存在,可以编辑、取消或克隆该电子流。 说明: 仅运维代表审批中的电子流可以撤回,已审批并处于变更状态的电子流无法撤回。 克隆变更电子流 在我的申请列表,单击待克隆变更电子流所在行“操作”列的。 可以修改信息后,单击“提交”。 转发变更电子流 我的申请列表,单击待转发变更电子流所在行“操作”列的。 配置转发任务信息,单击“确定”。
  • 创建变更电子流 进入AppStage运维中心。 将鼠标悬停在右上角的账号,选择下拉列表中的“工单管理”,默认显示“变更单管理”页面。 单击“新建”。 配置电子流参数,参数说明如表1所示,配置完成后,单击“提交”。 页面带“*”标志的参数为必填参数,如需保存草稿,需要将必填参数填写完整。 表1 新建变更电子流 参数类型 参数名称 参数说明 基本信息 部署站点 默认为当前站点。 变更类型 选择变更类型。 服务部署:服务版本升级部署。 服务优化:修复业务自身集成设施或组件相关安全漏洞;业务发展变化引发的容量变化、服务迁移、资源调整、可用性优化;服务配置修改。 运营支撑:营销活动支撑,包括营销活动支持、用户服务支持。 运维优化:包括服务运维优化、基础运维优化、运维安全优化、运维工具优化。 产品 选择需要变更的产品。 服务 选择需要变更的服务。 服务环境 选择需要变更的服务环境。 版本号 变更类型是“服务部署”时,需要选择服务部署的版本号。 变更标题 输入变更标题,默认前缀为“部署站点-服务-变更类型”。 变更内容 输入变更内容说明。 变更时间 部署计划时间 选择部署的计划开始时间和计划结束时间。 审批人 技术审核人(运维代表) 选择技术审核人,即运维代表。 变更电子流提交后会走给运维代表审核变更方案的合理性。 变更实施人 填写变更实施人。 运维代表审核后的电子流会走给变更实施人做变更实施。 变更验证人 填写变更验证人。 变更实施后电子流会走给变更验证人。 其他附件 - 变更方案以及其他指导性文档可以通过附件上传word文档。
  • 软件仓库包类型介绍 AppStage运维中心支持对软件包、部署包、镜像包、SQL包等进行集中管理,用于升级变更服务的虚拟机。软件仓库不同软件包的说明如表1所示。 同时支持将镜像仓SWR(SoftWare Repository for Container)进行统一管理,可以绑定使用镜像仓中的镜像用于服务的容器升级变更,具体操作请参见录入并绑定华为云镜像仓SWR。 表1 包类型说明 包类型 说明 传包方式 使用方式 打包规范 软件包 应用软件包,可使用虚拟机部署和容器部署,一般用于虚拟机部署,包括软件包(虚拟机部署使用)、测试用例包、函数包(函数部署使用)。 使用开发中心推包/上传软件包 在IaC代码中定义需要使用的软件包,通过IaC变更完成应用部署。 软件包 部署包 用户部署虚拟机时使用的脚本包(playbook文件)。 运维中心发布/使用开发中心推包/上传部署包 使用部署包创建模板,根据模板创建虚拟机部署的变更任务,实现使用部署脚本完成软件的自动化部署。 部署包 镜像包 用户容器部署时使用的Docker的容器镜像包。 使用开发中心推包 在IaC代码中定义需要使用的镜像包,通过IaC变更完成容器化部署。 镜像包 SQL包 执行SQL变更的DDL、DML数据库脚本。 使用开发中心推包/上传SQL包 在WiseDBA中使用SQL包进行SQL变更,对数据库或数据库数据进行增删改查的操作。 SQL包 IaC 3.0包 描述IaC 3.0变更的执行过程及资源配置信息。 使用开发中心推包/上传IaC 3.0包 在变更环境部署应用时选择IaC包,完成资源配置及环境变更。 IaC 3.0包 Terraform包 描述Terraform引擎变更的执行过程及资源配置信息。 使用开发中心推包 在Terraform引擎的实例列表中使用代码包创建变更计划,完成资源配置及环境变更。 Terraform包 OS镜像包 操作系统镜像发布,普通用户一般不需要使用。 - - - 父主题: AppStage软件仓库全局管理
  • 前提条件 已获取服务运维岗位权限,权限申请操作请参见申请权限。 已准备环境并启用,服务环境管理列表显示已启用环境,具体操作请参见为资源接入准备环境,如果已配置环境未启用,可以在服务环境管理列表单击“启用环境”,启用已配置的环境。 已纳管CCE容器集群,具体操作请参见CCE容器集群接入运维中心。 在微服务平台页面,新增环境信息并为环境绑定已纳管的CCE集群,具体操作请参见新增环境信息和为环境绑定CCE集群。 已使用开发中心推包或者手动上传软件包及IaC3.0包。 已准备变更电子流,具体操作请参见创建运维中心变更电子流,仅电子流中设置的变更实施人可使用该电子流进行变更部署。
  • AppStage运维中心首页介绍 AppStage运维中心首页如图2所示。 图2 运维中心首页 AppStage运维中心首页各模块功能如表1所示。 表1 首页功能说明 编号 功能区域 说明 1 顶部导航栏 :服务列表按钮,在服务列表可切换运维中心提供的BaaS服务和中间件。 运维中心:单击可切换至运维中心首页。 站点:可切换站点,当前仅支持“中国区2CBU生产”站点。 自有服务:可切换自有服务,即在业务控制台创建的产品及服务。 专项角色:可切换专项角色,专项角色可在组织内跨租户进行管理,具备跨租户的管理权限,包括基础运维角色、DBA(数据库DBA角色)等,如需申请专项角色权限请参见申请权限。 处于专项角色时,单击可退出专项角色。 :单击可复制分享链接。 EN/简体:可切换语言。 2 个人账号信息管理 审计日志:可查看登录账号在运维中心的所有操作日志,产品管理员可查看对应产品的所有操作日志。 我的信息:可以查看个人信息和已拥有的权限,也可以进行权限申请。 文档中心:可进入查看运维中心文档帮助。 工单管理:支持变更单与事件单的管理,具体介绍请参见管理运维中心工单。 服务环境配置:可以录入公有云账号、配置企业项目以及进行环境管理,具体介绍请参见配置服务环境。 租户管理:“我的租户”页面可以查看在业务控制台创建的组织(租户)、产品、服务和微服务信息。“订阅信息”页面可以查看已订阅的服务信息。“ WeLink 对接”页面可以配置对接的华为云Welink信息,对接后可以使用WeLink公众号收取监控服务的告警及事件通知,具体操作请参见运维中心对接华为云WeLink。 退出登录:退出当前登录账号。 3 运维接入一站式地图 可以按照指引完成运维接入,将华为云VPC、E CS 、CCE等接入运维中心进行运维管理,具体操作请参见将资源和数据接入AppStage运维中心。 4 常用功能 最近访问:展示近期已访问的服务,可单击快速访问。 书签:展示已收藏书签内容,可单击快速访问。 单击页面右侧悬浮菜单中的收藏按钮进行收藏,收藏后该页面可展示在已收藏书签列表。 已集成中间件:展示已集成的中间件。 已订阅服务:展示已订阅的服务。 5 告警 展示近期告警数据,将鼠标放置在该区域后单击,可进入监控服务页面查看详情数据。 6 CPU使用率 展示CPU使用情况,将鼠标放置在该区域后单击,可进入实时监控页面查看详细数据。 7 用户信息 显示当前用户信息,可以快捷查看已有权限或进行权限申请。 8 帮助文档 查看运维中心帮助文档。
  • 部署服务 表1 部署服务基本概念 基本概念 说明 资源 资源是具备一定功能和作用的实例,是部署服务的管理对象,如WiseCloud::MicloudService::NuwaContainer实例、WiseCloud::Cache::DCS实例等。 组件 组件是一个具有相同资源的集合,组件具备以下特点: 可以在组件中声明资源以及资源之间的依赖关系。 同一个资源只能属于一个组件。 组件下的所有资源上下文一致。 环境 环境是一个具有相同组件的集合,环境具有以下特点: 部署服务代码中的environment-id是“环境”的唯一索引。 不同环境下的组件和资源可以同名,同一环境下的资源和组件名称需要保证唯一。 一个组件只能属于一个环境,一个环境下会有多个组件。 环境变更的本质是环境下组件的变更。 流水线 流水线是将多个组件的变更组合起来的流程描述,描述各个组件变更的方式和次序。 变更工单 变更工单是实施现网变更的授权许可,业务需要发起现网变更时,通常会由研发人员提交变更电子流,并附上对应的变更文档。该电子流被审批通过后,会在变更工单管理中,创建一条对应的变更工单,运维人员可使用变更工单实施变更。 变更计划 变更计划是部署服务发起具体变更动作前的风险影响评估过程。通过风险影响评估过程可以得到,本次变更可能导致的资源动作和属性差异变化,以及可能的风险项。 变更风险项 变更风险项是某个资源的具体变更的风险认定。其描述了认定为风险变更的属性变化,以及能够审批允许的审批人列表。 变更电子流 变更电子流是用于无人值守变更的高度自动化的变更方式,是在部署服务基础上,尽可能将所有的运维手工选择操作前移到提交电子流之前。 Terraform Terraform是HashiCorp公司开发的基础设施即代码(Infrastructure-as-Code,IaC)软件,它能自动化的进行 资源编排 ,用于安全高效地预览、配置和管理云基础架构和资源,并提供自定义解决方案。
  • 监控服务 表2 监控服务基本概念 基本概念 说明 监控 是采集、汇总和分析IT基础设施、服务组件以及程序应用的运行指标,以了解其当前状态和运行状况,判断是否安全可靠的过程,是保证业务持续稳定运行的重要手段。 告警 告警是监控系统的响应组件,它根据指标值的变化按照既定的策略执行响应操作,其主要目的是引起人们对系统当前状态的关注。告警定义包含基于指标的条件或阈值以及当指标值达到或超出定义条件时要执行的操作。 告警通知 告警的通知在所有的告警处理的链路结束以后才会发生。告警处理模块会根据上报告警的上下文获取告警的值班配置,值班配置由业务预置。 告警屏蔽 为您提供短时间的屏蔽功能,可以通过设置告警屏蔽的规则,告警将在屏蔽的时间内不再触发任何通知,规则结束后,将会被再次唤醒,屏蔽期间告警被清除后,将不再触发任何通知,减少您的处理频度。 告警过滤 告警过滤是直接在接入的阶段就将告警屏蔽,告警仍然会进入Bypass的数据库但不会再向下发送给告警处理模块。 告警收敛 多个维度的告警,通过特定的条件将它们变为一条告警,只需要配置自定义的收敛规则,就可以将重复告警收敛到一起,还有默认的规则帮助你维护告警。 告警标记 告警标记的作用是为一段时间内的告警打上标签,例如现网变更或者现网演练时,由于要模拟大量异常请求和其他操作会造成大量无用告警上报,标记的作用就是为这一段时间的告警打上标签与正常告警进行区分。 告警定义 对于繁琐复杂的告警上报字段感到困惑,使用统一定义,将会自动下发到业务对应的agent,更加人性化的界面设计,使告警上报更加统一、准确。 告警修复 设置特定的命中条件,告警在发送通知之前会执行预置的修复脚本,进行修复操作,自动帮你修复简单的告警。 语音值班配置 当告警生成时,配置对应的责任人,通过WeLink、短信、电话等多种形式,快速将异常情况通知到责任人。 日志 日志是指设备、系统或服务程序在运作时都会产生的事件记录,每一行日志都记载着日期、时间、使用者及动作等相关操作的描述。一般系统会有各种各样的日志文件,如应用程序日志,安全日志、系统日志、Scheduler服务日志、WWW日志、DNS服务器日志等。 日志项目 日志项目是一个包含多个日志服务配置的整体,可以看作是一个微服务实例。 同一个微服务实例下的日志服务配置应当包含在一个日志项目中。 不同微服务实例使用完全相同的日志服务配置时,也可以共用同一个日志项目。 日志空间 日志空间是日志服务为微服务的日志分配的使用空间。 业务须在日志接入页面填写日志相关信息并提交申请日志空间,日志空间支持定义空间内日志的结构化格式信息,此时要求所有使用此空间的日志都满足该日志格式。 日志采集配置 日志采集配置是日志服务采集端在采集微服务实例中日志时所需的配置,一种日志对应一项采集配置。 日志采集配置须归属于一个日志项目,并使用一个已分配好的日志空间。 日志采集配置之间可以共用日志空间,此时需要关注日志空间的日志格式要求,未定义日志格式的空间可不用关注。 事件 事件是指IT基础设施、服务组件以及程序应用等运行过程中发生的问题。事件可通过监控系统自动生成、客户报障生成或SRE主动巡检生成等。监控系统生成事件首先要采集和分析运行数据,然后根据预定规则判断是否需要生成事件。 HCW HW Cloud Watch,AppStage运维中心提供的监控系统,也称为云眼,可以提供监控、告警功能。 HCW Agent 监控系统的采集框架,需要在每台主机上部署,部署路径为/opt/huawei/HCW_Agent。 EAP 事件自动化平台(Event & Action Platform,EAP),通过集成各系统动作,解决复杂运维场景的操作编排功能。 流程 可以通过EAP平台所提供的各种动作组合来编排解决具体运维场景的流程。 动作 各服务的操作(例如部署任务、执行作业、确认告警等)封装。 标签 对某一类特定群体或对象的某项特征进行的抽象分类和概括,其值(标签值)具备可分类性。 标签树 标签树负责标签的管理,包括标签的创建,删除,修改。系统标签由系统管理员统一进行管理,业务自定义标签由业务人员进行管理。 逻辑主体 逻辑主体是业务实体的抽象,是基于物理表(MPPDB、ClickHouse、Influxdb)创建。逻辑主体和物理表之间存在映射关系,逻辑主体的字段名称和物理表可以不一样,这也是为了实现业务属性和物理表之间的解耦。 一个逻辑主体可以映射多种物理实体,当底层数据物理表变更,上层的指标逻辑定义可以不用发生变化。 指标 指标是指在被观测系统中观察和收集的资源使用或行为的测量值,可能是原始采集的数据,也可能是后期经过各种计算和统计方法得到的数值。 令牌 令牌是使用数据源的鉴权方式,只有通过对应业务的token的鉴权,才能使用对应的数据源。 视图 指标本身包含了业务计算规则,只有结合数据源才能真正被查询。视图,就是指标 + 物理表的结合,也是监控大盘上直接可被查询的对象。视图可以包含一个或多个指标,例如折线图只需要单指标的视图,但是表格就需要多指标的视图。 查询视图(Query View)。直接作用于物理表的查询视图,大多用在druid实时监控场景。 长期存储视图(Long Term View)。基于查询视图,可以创建长期存储视图。如果觉得某个查询视图值得被长期持久化,就可以使用该能力。长期存储视图会自动创建三个聚合任务,分别是5分钟粒度、小时粒度、天粒度。 持久化视图(Persistent View)。基于查询视图,可以创建持久化视图。部分视图需要出日报,就可以使用该能力。该视图会自动创建一个汇聚任务。 异常检测视图(Anomaly Detect View)。基于查询视图,可以创建异常检测视图,用来为异常检测任务提供数据。 插件 可在机器上执行并采集各项参数的二进制文件或者脚本。
  • 使用流程 参考图1可帮助您快速上手运维中心的主流程和核心功能。 图1 运维中心使用流程 准备环境:需要先准备环境,具体操作请参见配置服务环境。 准备资源:可以参考资源接入运维中心,将华为云已购买的资源接入至运维中心,或者在代码中定义相关信息,通过代码包部署应用,完成资源申请。 运维中心支持使用部署服务,进行应用的自动化部署。或者使用监控服务,对您的应用进行运维管理。 应用部署:使用开发中心将开发完成的应用软件包及IaC3.0包通过流水线发布至运维中心软件仓库,或者将已有的包上传至部署服务,并准备变更电子流,具体操作请参见创建运维中心变更电子流。 应用运维:监控服务提供采集日志、开发并查看监控报表和异常告警等功能。 日志:监控服务提供兼具开箱即用和自助的日志接入能力,支持存算分离,提高日志检索效率;提供虚拟机、容器统一的日志采集Agent;通过采集侧清晰和汇聚指标提取等能力降低日志成本,提高日志的可靠性。 监控:监控服务支持实时监控应用及资源,采集各项指标及事件等数据以分析应用健康状态,提供全面、清晰、多维度 数据可视化 能力。 告警:监控服务提供静态阈值和异常检测生成告警的能力,提供告警抑制、告警收敛、告警自动化分析和恢复能力。 资源管理 规划并管理网络资源:您可以使用弹性网络服务对容器资源进行管理。 管理容器:您可以使用弹性资源服务对容器资源进行管理。 管理主机:您可以使用主机管理服务对主机资源进行管理。 管理数据库:您可以使用数据库治理对数据库资源进行管理。
  • 部署服务 基础设施即代码(Infrastructure as code,简称IaC)是一种基于软件开发实践形成的基础设施的自动化方法,它强调一致、可重复的供给和变更系统及其配置。当代码发生变更后,可以进行自动化测试,测试完成后可自动化的应用变更到运行系统中。使用基础设施即代码的方法,可以使用敏捷工程的优秀实践(如测试驱动开发、持续集成、持续发布)可以快速安全的变更基础设施。 部署服务按架构元素(服务)组织资源,软件单元(微服务或函数)作为最小变更单元 ,执行变更的结果围绕服务环境进行资源管理,每个组件可以独立发布版本、独立变更。
共100000条