云服务器内容精选

  • 管理触发器 成功创建后即可在“触发器”页面查看已创建的触发器规则,您可以执行以下操作管理触发器。 修改规则状态:表示规则启用,表示规则关闭。新创建的触发器规则默认为启用状态,您可以自行调整。 编辑:重新编辑触发器规则,除“命名空间”和“请求地址”外,其余参数均可编辑。 删除:删除该触发器规则。 查看触发历史:当有符合触发器规则的动作发生时,自动触发该规则,您可以单击图标查看触发历史。包含信息如下: 表2 触发历史 参数 说明 触发动作 产生该次触发的触发动作。 触发资源 产生该次触发动作的仓库资源。 状态 触发器执行Webhook请求的状态。 创建时间 该次触发的启动时间,即发起Webhook请求的时间。 图2 管理触发器
  • 服务概述 云原生时代业务和技术的复杂性不断攀升,表现为业务迭代速度越来越快、应用系统架构愈发复杂、跨团队协作越来越频繁,导致风险及成本越来越高,这极大制约了业务的稳定性和可用性,混沌工程的出现,就是赋予业务在面对失控条件时具备较强的可观测性和故障恢复能力。 运维内容实施支持服务的混沌演练实施支持服务,是基于华为云COC混沌演练平台,承载华为云混沌工程的最佳实践,为用户提供一站式自动化混沌演练能力,覆盖从风险识别、应急预案管理、故障注入到复盘改进的端到端演练流程,使能用户对云上应用进行主动风险识别、风险管理和消减,提升业务韧性。
  • 服务范围 服务覆盖范围 运维内容实施支持服务的混沌演练实施支持服务覆盖范围如下: 运维内容实施支持服务的混沌演练实施支持服务基于COC混沌演练平台提供一站式的自动化演练能力,覆盖端到端的演练流程。 针对云主机、云原生、华为云中间件服务、Java应用等场景提供混沌演练。 在线识别和管理云应用的故障模式、应急预案,对风险进行闭环消减。 服务不覆盖范围 运维内容实施支持服务的混沌演练实施支持服务不覆盖范围如下: 不提供应用系统的设计和运维工作,包括不限于客户应用开发、测试、部署、迁移等。 不提供第三方软件的安装、补丁更新、测试、故障诊断、优化等日常运维服务。 不提供IDC和硬件设备维护,如网络设备、服务器、存储等硬件巡检、更换、诊断等。 服务区域 中国
  • 责任矩阵 共同责任 双方商定并确认具体业务需求、范围及目标。 双方商定并确认项目管理计划,对项目周期、实施标准、风险管控、项目质量、项目验收标准等达成共识。 双方就演练方案、验收标准进行商定,确认方案内容并评审。 完成合同签订。 华为责任 华为需明确此次项目的负责人,因特殊情况导致华为人员变更,需要提前3个工作日知会用户,直至项目最终验收完成。 华为得到用户授权后,授权数据仅限用于专业服务中涉及的服务内容,不得超出限定范围。 客户责任 提供详细准确的需求和场景。 提供业务系统相关的信息,包括但不限于应用架构、部署架构、资源信息。 提供因演练场景需要必要的授权,配合华为云演练过程中工作开展。 审核并确认华为提供的交付件。 责任分工矩阵表 以下为职责描述案例,可酌情修改。 R=责任方/Responsibility S=协助方/Support 序号 流程 工作内容 华为 用户 1 混沌演练规划 组建团队。 需求评估。 信息收集。 演练启动会。 演练范围授权。 R S 2 混沌演练准备 确定演练计划,各场景演练目标。 演练涉及范围,演练时间窗和演练日期。 历史故障分析。 调研故障场景。 输出演练方案。 S R 3 混沌演练执行 演练方案实施。 故障注入。 记录演练风险、告警、发生时间等。 评估客户业务韧性、故障影响、恢复能力以及可恢复性等。 输出故障演练结果。 R S 4 混沌演练复盘 演练方案与执行结论分析。 评估演练是否达到预期。 输出演练方案、改进点与后续方案。 R S
  • ers-monitoring和ers-manger有什么区别? ers-monitoring是安装监控插件cluster-monitoring所用的命名空间,如果想要监控CCE容器集群状态,需要安装cluster-monitoring监控插件,具体请参见使用插件模板为容器集群安装插件,安装后该插件会采集容器的监控数据,同时生成ers-monitoring命名空间。删除cluster-monitoring插件不会删除ers-monitoring命名空间。 ers-manager是安装代理插件cluster-agent所用的命名空间,使用运维中心ERS纳管CCE容器集群时,会自动为该集群安装cluster-agent插件,用于管理集群、同步权限、实现容器EAP等功能,同时生成ers-manager命名空间。删除cluster-agent插件不会删除ers-manager命名空间。 父主题: 运维中心弹性资源服务
  • 问题描述 在 CES 数据管理中创建采集指标模板或者自定义采集指标报错。可能的报错如下: Policy doesn't allow [ces:metricData:list] to be performed., code=ces.0050} #AppStage平台没有CES权限,需要申请CES FullAccess或者CES ReadOnlyAccess权限 You are not authorized with rms:resources:list #AppStage平台没有 RMS 权限,需要申请RMS FullAccess或者RMS ReadOnlyAccess权限。
  • 已申请权限,但是仍然没有权限操作 检查 IAM 和ACMS是否属于应用平台的同一个站点,需要在哪个站点操作ACMS,就通过该站点的应用平台进入IAM申请权限。 如果站点一致,则检查ACMS上的服务和IAM里有权限的服务是否一致。当前服务下,必须有服务运维岗位权限或运维管理员权限。 如果上述检查正确,但仍然没有权限,那么重新登录,再回到ACMS,查看是否有权限。 如果重新登录后依然没有权限,在ACMS中,按F12,打开工作台,刷新页面,找到findUserPolicies,在响应中搜索是否存在SecurityTokenService_SDM。 如果不存在,就是没有申请权限,如果缺少SecurityTokenService_SDM,就需要申请服务的服务运维岗位权限或运维管理员权限 如果存在,但页面上依然报错,请联系支撑人员定位,将站点名称、定位过程、findUserPolicies中的响应内容,提供给支撑人员。 父主题: 运维中心访问凭据管理服务
  • 处理方法 检查是否禁用了root 。 执行cat /etc/ssh/sshd_config | grep PermitRootLogin,查看是否有两个PermitRootLogin。 是:需要注释或删掉一个,如下图所示,并且修改成yes,然后重启服务systemctl restart sshd。 否:修改为yes,然后重启systemctl restart sshd。 检查root公钥是否写入。 cat /root/.ssh/authorized_keys和VMS特权账号规划里的SSH公钥对比,有一个存在即可。
  • 如何自动获取验签? 检查对应的服务环境,是否已部署了对应的镜像包。 Docker镜像包的完整坐标(图中packagePath),需包含SWR地址,也即swr.cn-north-4.myhuaweicloud.com。不完整的Docker镜像包坐标无法获取相关Sha256验签信息。此处packagePath是Nuwa平台返回的。 已确定部署了相关的docker镜像,但是CloudTest不展示相关镜像包的验签,可简单触发一次空部署,等待10分钟重新执行一次CloudTest相关任务。 父主题: 运维中心部署服务
  • 运维中心基本概念 基本概念 说明 资源 资源是具备一定功能和作用的实例,是部署服务的管理对象,如WiseCloud::MicloudService::NuwaContainer实例、WiseCloud::Cache::D CS 实例等。 组件 组件是一个具有相同资源的集合,组件具备以下特点: 可以在组件中声明资源以及资源之间的依赖关系。 同一个资源只能属于一个组件。 组件下的所有资源上下文一致。 环境 环境是一个具有相同组件的集合,环境具有以下特点: 部署服务代码中的environment-id是“环境”的唯一索引。 不同环境下的组件和资源可以同名,同一环境下的资源和组件名称需要保证唯一。 一个组件只能属于一个环境,一个环境下会有多个组件。 环境变更的本质是环境下组件的变更。 流水线 流水线是将多个组件的变更组合起来的流程描述,描述各个组件变更的方式和次序。 变更工单 变更工单是实施现网变更的授权许可,业务需要发起现网变更时,通常会由研发人员提交变更电子流,并附上对应的变更文档。该电子流被审批通过后,会在变更工单管理中,创建一条对应的变更工单,运维人员可使用变更工单实施变更。 变更计划 变更计划是部署服务发起具体变更动作前的风险影响评估过程。通过风险影响评估过程可以得到,本次变更可能导致的资源动作和属性差异变化,以及可能的风险项。 变更风险项 变更风险项是某个资源的具体变更的风险认定。其描述了认定为风险变更的属性变化,以及能够审批允许的审批人列表。 变更电子流 变更电子流是用于无人值守变更的高度自动化的变更方式,是在部署服务基础上,尽可能将所有的运维手工选择操作前移到提交电子流之前。 Terraform Terraform是HashiCorp公司开发的基础设施即代码(Infrastructure-as-Code,IaC)软件,它能自动化的进行 资源编排 ,用于安全高效地预览、配置和管理云基础架构和资源,并提供自定义解决方案。 监控 是采集、汇总和分析IT基础设施、服务组件以及程序应用的运行指标,以了解其当前状态和运行状况,判断是否安全可靠的过程,是保证业务持续稳定运行的重要手段。 告警 告警是监控系统的响应组件,它根据指标值的变化按照既定的策略执行响应操作,其主要目的是引起人们对系统当前状态的关注。告警定义包含基于指标的条件或阈值以及当指标值达到或超出定义条件时要执行的操作。 告警通知 告警的通知在所有的告警处理的链路结束以后才会发生。告警处理模块会根据上报告警的上下文获取告警的值班配置,值班配置由业务预置。 告警屏蔽 为您提供短时间的屏蔽功能,可以通过设置告警屏蔽的规则,告警将在屏蔽的时间内不再触发任何通知,规则结束后,将会被再次唤醒,屏蔽期间告警被清除后,将不再触发任何通知,减少您的处理频度。 告警过滤 告警过滤是直接在接入的阶段就将告警屏蔽,告警仍然会进入Bypass的数据库但不会再向下发送给告警处理模块。 告警收敛 多个维度的告警,通过特定的条件将它们变为一条告警,只需要配置自定义的收敛规则,就可以将重复告警收敛到一起,还有默认的规则帮助用户维护告警。 告警标记 告警标记的作用是为一段时间内的告警打上标签,例如现网变更或者现网演练时,由于要模拟大量异常请求和其他操作会造成大量无用告警上报,标记的作用就是为这一段时间的告警打上标签与正常告警进行区分。 告警定义 对于繁琐复杂的告警上报字段感到困惑,使用统一定义,将会自动下发到业务对应的agent,更加人性化的界面设计,使告警上报更加统一、准确。 告警修复 设置特定的命中条件,告警在发送通知之前会执行预置的修复脚本,进行修复操作,自动帮你修复简单的告警。 语音值班配置 当告警生成时,配置对应的责任人,通过 WeLink 、短信、电话等多种形式,快速将异常情况通知到责任人。 日志 日志是指设备、系统或服务程序在运作时都会产生的事件记录,每一行日志都记载着日期、时间、使用者及动作等相关操作的描述。一般系统会有各种各样的日志文件,如应用程序日志,安全日志、系统日志、Scheduler服务日志、WWW日志、DNS服务器日志等。 日志项目 日志项目是一个包含多个日志服务配置的整体,可以看作是一个微服务实例。 同一个微服务实例下的日志服务配置应当包含在一个日志项目中。 不同微服务实例使用完全相同的日志服务配置时,也可以共用同一个日志项目。 日志空间 日志空间是日志服务为微服务的日志分配的使用空间。 业务须在日志接入页面填写日志相关信息并提交申请日志空间,日志空间支持定义空间内日志的结构化格式信息,此时要求所有使用此空间的日志都满足该日志格式。 日志采集配置 日志采集配置是日志服务采集端在采集微服务实例中日志时所需的配置,一种日志对应一项采集配置。 日志采集配置须归属于一个日志项目,并使用一个已分配好的日志空间。 日志采集配置之间可以共用日志空间,此时需要关注日志空间的日志格式要求,未定义日志格式的空间可不用关注。 事件 事件是指IT基础设施、服务组件以及程序应用等运行过程中发生的问题。事件可通过监控系统自动生成、客户报障生成或SRE主动巡检生成等。监控系统生成事件首先要采集和分析运行数据,然后根据预定规则判断是否需要生成事件。 HCW HW Cloud Watch,AppStage运维中心提供的监控系统,也称为云眼,可以提供监控、告警功能。 HCW Agent 监控系统的采集框架,需要在每台主机上部署,部署路径为/opt/huawei/HCW_Agent。 EAP 事件自动化平台(Event & Action Platform,EAP),通过集成各系统动作,解决复杂运维场景的操作编排功能。 流程 可以通过EAP平台所提供的各种动作组合来编排解决具体运维场景的流程。 动作 各服务的操作(例如部署任务、执行作业、确认告警等)封装。 标签 对某一类特定群体或对象的某项特征进行的抽象分类和概括,其值(标签值)具备可分类性。 标签树 标签树负责标签的管理,包括标签的创建,删除,修改。系统标签由系统管理员统一进行管理,业务自定义标签由业务人员进行管理。 逻辑主体 逻辑主体是业务实体的抽象,是基于物理表(MPPDB、ClickHouse、Influxdb)创建。逻辑主体和物理表之间存在映射关系,逻辑主体的字段名称和物理表可以不一样,这也是为了实现业务属性和物理表之间的解耦。 一个逻辑主体可以映射多种物理实体,当底层数据物理表变更,上层的指标逻辑定义可以不用发生变化。 指标 指标是指在被观测系统中观察和收集的资源使用或行为的测量值,可能是原始采集的数据,也可能是后期经过各种计算和统计方法得到的数值。 令牌 令牌是使用数据源的鉴权方式,只有通过对应业务的token的鉴权,才能使用对应的数据源。 视图 指标本身包含了业务计算规则,只有结合数据源才能真正被查询。视图,就是指标 + 物理表的结合,也是监控大盘上直接可被查询的对象。视图可以包含一个或多个指标,例如折线图只需要单指标的视图,但是表格就需要多指标的视图。 查询视图(Query View)。直接作用于物理表的查询视图,大多用在druid实时监控场景。 长期存储视图(Long Term View)。基于查询视图,可以创建长期存储视图。如果觉得某个查询视图值得被长期持久化,就可以使用该能力。长期存储视图会自动创建三个聚合任务,分别是5分钟粒度、小时粒度、天粒度。 持久化视图(Persistent View)。基于查询视图,可以创建持久化视图。部分视图需要出日报,就可以使用该能力。该视图会自动创建一个汇聚任务。 异常检测视图(Anomaly Detect View)。基于查询视图,可以创建异常检测视图,用来为异常检测任务提供数据。 插件 可在机器上执行并采集各项参数的二进制文件或者脚本。 微服务 微服务是云原生应用的最佳架构, 它提倡将单一应用程序划分成一组小的服务,服务之间互相协调、互相配合,为用户提供最终价值。每个微服务运行在其独立的进程中, 微服务与微服务间采用轻量级的通信机制互相沟通。每个微服务由全功能团队独立构建、独立测试,并且能够被独立地部署到生产环境。微服务的特点:组件化、松耦合、服务自治、去中心化。 应用 完成某项完整业务场景的软件系统。应用一般由多个微服务组成,应用里面的微服务能够相互发现和调用。 NUWA框架 NUWA提供一个完整的微服务开发框架,是一个开箱即用的应用级容器,以插件的形式汇聚云服务平台能力,让开发把时间更多的花在业务代码逻辑上。 Kubernetes Kubernetes是一个开源的,用于管理云平台中多个主机上的容器化的应用,Kubernetes的目标是让部署容器化的应用简单并且高效(powerful),Kubernetes提供了应用部署、规划、更新、维护的一种机制。 Pod Pod是Kubernetes创建或部署的最小单位。一个Pod封装一个或多个容器、存储资源、一个独立的网络IP以及管理控制容器运行方式的策略选项。 Node Node是一个执行具体工作的机器,可以是虚拟机或者物理机。Pod是部署在Node节点上的,如果Node故障,整个Pod会被调度到集群中的另外可用的Node节点上去。 工作负载 工作负载是在Kubernetes上运行的应用程序。无论您的工作负载是单个组件还是协同工作的多个组件,您都可以在Kubernetes上的一组Pod中运行它。在Kubernetes中,工作负载是对一组Pod的抽象模型,用于描述业务的运行载体,包括Deployment、StatefulSet、DaemonSet、Job、CronJob等多种类型。 无状态工作负载:即Kubernetes中的“Deployment”,无状态工作负载支持弹性伸缩与滚动升级,适用于实例完全独立、功能相同的场景,如:nginx、wordpress等。 有状态工作负载:即Kubernetes中的“StatefulSet”,有状态工作负载支持实例有序部署和删除,支持持久化存储,适用于实例间存在互访的场景,如ETCD、mysql-HA等。 创建守护进程集:即Kubernetes中的“DaemonSet”,守护进程集确保全部(或者某些)节点都运行一个Pod实例,支持实例动态添加到新节点,适用于实例在每个节点上都需要运行的场景,如ceph、fluentd、Prometheus Node Exporter等。 普通任务:即Kubernetes中的“Job”,普通任务是一次性运行的短任务,部署完成后即可执行。使用场景为在创建工作负载前,执行普通任务,将镜像上传至镜像仓库。 定时任务:即Kubernetes中的“CronJob”,定时任务是按照指定时间周期运行的短任务。使用场景为在某个固定时间点,为所有运行中的节点做时间同步。 父主题: 运维中心简介
  • 应用场景 使用SLB为高访问量业务进行流量分发 对于业务量访问较大的业务,可以通过SLB设置相应的分配策略,将访问量均匀的分到多个后端服务器处理。例如大型门户网站,移动应用市场等。 使用SLB消除单点故障 对可靠性有较高要求的业务,可以在SLB上添加多个后端服务器。SLB会通过健康检查及时发现并屏蔽有故障的服务器,并将流量转发到其他正常运行的后端服务器,确保业务不中断,例如官网,计费业务,Web业务等。 使用SLB跨可用区特性实现业务容灾部署 对可靠性和容灾有很高要求的业务,SLB可将流量跨可用区进行分发,建立实时的业务容灾部署。即使出现某个可用区网络故障,SLB仍可将流量转发到其他可用区的后端服务器进行处理,例如银行业务,警务业务,大型应用系统等。
  • 概述 账号管理为用户提供针对华为云ECS、RDS、中间件等资源实例的人机帐号密码集中管理能力。多种帐号进行统一收口,避免多资源帐号密码易遗忘、多人知晓密码信息易泄漏等风险,用户可通过帐号管理来获取主机密码,在安全管控下支持无需输入密码可登录linux主机执行命令。账号密码管理、自动改密和免密登录操作如下。 账号密码管理场景步骤: 导入账号、查看账号密码。 自动改密及免密登录场景步骤: 当前已有资源可自动改密:账号管理-账号基线中配置账号基线。 后续新增资源的自动改密:账号管理-改密策略中配置改密策略。 按照region维度定期改密:账号管理-改密任务添加region。 配置后可查看账号密码、免密登录。 自动改密当前支持的区域如下: 华北-北京一 华东-上海二 华东-上海一 华南-广州 亚太-新加坡 亚太-曼谷 非洲-约翰内斯堡 华北-乌兰察布一 西南-贵阳一 华北-北京二 华北-乌兰察布-汽车一 华北-北京四 中国-香港 华北-乌兰察布二零一 拉美-圣地亚哥 父主题: 账号管理
  • 操作场景 根据业务需要,您可以通过云运维中心进行策略设置,确保您新增的主机实例也能被定期改密。 改密策略分为全局基线和组件基线。 全局基线改密策略:开启全局维度的改密策略后,所有未绑定组件的增量主机实例将会被定期改密。 组件基线改密策略:开启组件维度的改密策略后,所有被选中的组件下的增量主机实例将会被定期改密。 若需设置部分主机不参与自动改密,请前往“资源管理>应用资源管理”页面标签管理,设置标签键=COCAccountPasswordAutoManagement,标签值=NotManagePassword。设置后,预计1小时内生效 。
  • COC自定义策略样例 示例1:授权用户创建运维事务 { "Version": "1.1", "Statement": [ { "Effect": "Allow", "Action": [ "coc:task:create" ] } ]} 示例2:拒绝用户删除文档 拒绝策略需要同时配合其他策略使用,否则没有实际作用。用户被授予的策略中,一个授权项的作用如果同时存在Allow和Deny,则遵循Deny优先。 如果您给用户授予COC FullAccess的系统策略,但不希望用户拥有COC FullAccess中定义的删除文档的权限,您可以创建一条拒绝删除文档的自定义策略,然后同时将COC FullAccess和拒绝策略授予用户,根据Deny优先原则,则用户可以对COC执行除了删除文档外的所有操作。拒绝策略示例如下: { "Version": "1.1", "Statement": [ { "Effect": "Deny", "Action": [ "coc:document:delete" ] } ]} 示例3:多个授权项策略 一个自定义策略中可以包含多个授权项,且除了可以包含本服务的授权项外,还可以包含其他服务的授权项,可以包含的其他服务必须跟本服务同属性,即都是项目级服务。多个授权语句策略描述如下: { "Version": "1.1", "Statement": [ { "Effect": "Allow", "Action": [ "coc:document:create", "scm:cert:complete" ] } ]}
  • COC自定义策略样例 示例1:授权用户创建运维事务 { "Version": "5.0", "Statement": [ { "Effect": "Allow", "Action": [ "coc:task:create" ] } ]} 示例2:拒绝用户删除文档 拒绝策略需要同时配合其他策略使用,否则没有实际作用。用户被授予的策略中,一个授权项的作用如果同时存在Allow和Deny,则遵循Deny优先。 如果您给用户授予COC FullAccessPolicy的系统策略,但不希望用户拥有COC FullAccessPolicy中定义的删除文档的权限,您可以创建一条拒绝删除文档的自定义策略,然后同时将COC FullAccessPolicy和拒绝策略授予用户,根据Deny优先原则,则用户可以对COC执行除了删除文档外的所有操作。拒绝策略示例如下: { "Version": "5.0", "Statement": [ { "Effect": "Deny", "Action": [ "coc:document:delete" ] } ]} 示例3:多个授权项策略 一个自定义策略中可以包含多个授权项,且除了可以包含本服务的授权项外,还可以包含其他服务的授权项,可以包含的其他服务必须跟本服务同属性,即都是项目级服务。多个授权语句策略描述如下: { "Version": "5.0", "Statement": [ { "Effect": "Allow", "Action": [ "coc:document:create", "scm:cert:complete" ] } ]}