搜索_华为云

常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

/内存/磁盘容量使用率过高检测：通过AOM监控CCE集群的CPU/内存/磁盘容量使用率。恢复：根据业务情况，手工变更集群规格或扩展资源。 CCE节点的CPU /内存/磁盘容量/磁盘IOPS/GPU/GPU缓存使用率过高检测：通过AOM监控CCE节点的CPU/内存/磁盘容量/磁盘IOPS/GPU/GPU缓存使用率。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > CCE云容器引擎
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

灾，当一个AZ异常时，另一个AZ节点不受影响，备节点会自动升级为主节点，对外提供服务。监控告警配合CES服务，支持对DCS的CPU、内存、磁盘、网络等进行监控和告警。详见“支持的监控指标”。父主题： DCS分布式缓存服务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
信息管理类应用典型部署架构（99.95%） - 云架构中心

备份数据恢复，可以满足可用性目标要求。容灾应用跨3AZ部署，AZ故障时自动恢复。监控告警支持业务运行状况、成功指标的检查，在发生故障时告警；支持云服务实例负载状态及资源故障切换等的监控，在负载超过阈值或状态异常时告警。弹性扩缩容针对内部用户场景，资源足够，无需自动弹性

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
云运维中心(COC) - 云架构中心
云运维中心(COC) - 云架构中心

云运维中心(COC) 云运维中心（Cloud Operations Center，简称COC）为用户提供安全、高效的一站式智能运维平台，满足客户集中运维诉求。承载华为云确定性运维业务场景，提供变更管理、批量运维等核心特性，实现在安全合规的前提下，提升用户运维能力成熟度和云上运维效率。COC产品介绍：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
COST08-02 云原生架构改造 - 云架构中心

风险等级中关键策略基于云原生架构改造，主要是应用容器化和微服务化的改造，从而发挥云原生的优势，如：自动弹性扩缩容等，容器技术可以提高资源利用率，避免闲置资源，从而降低计算成本，应用微服务化可以降低运维复杂度，从而降低运维成本。广告电商等在线作业服务SLA要求较高，高峰时段明显，使

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST08 进行架构优化
人工智能性能优化 - 云架构中心

会消耗算力、带宽；空间转移主要是消耗I/O带宽，有一定的时延，可能会降低吞吐。观测性能指标指标ID 指标名称指标说明 cpu_usage CPU使用率该指标用于统计ModelArts用户服务的CPU使用率。 mem_usage 内存使用率该指标用于统计ModelArts用户服务的内存使用率。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
概念表 - 云架构中心
概念表 - 云架构中心

(Availability) 产品在任意随机时刻需要和开始执行任务时，处于可工作或可使用状态的程度。它的概率度量称为可用度云服务指标 SLI Service level Indicator，面向服务的指标，如：请求响应成功率云服务目标 SLO Service Level Object，面向服务的目标，如

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念
COST07-04 合理降配低负载资源或升配高负载资源 - 云架构中心

COST07-04 合理降配低负载资源或升配高负载资源风险等级中关键策略根据工作负载和资源特征选择合适的资源大小或类型。您可通过持续监控资源利用率，发现资源的利用率低于/高于阈值，选择降配或者升配资源来优化成本。父主题： COST07 管理和优化资源

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST07 管理和优化资源
Kafka性能优化 - 云架构中心
Kafka性能优化 - 云架构中心

高吞吐量，同时也会产生一定延迟。观测性能指标 Kafka提供了以下性能相关监控指标，从这些指标可以帮助分析消息堆积、分区数据倾斜、流量倾斜等问题。指标ID 指标名称指标说明 broker_disk_usage 磁盘容量使用率该指标为从Kafka节点虚拟机层面采集的磁盘容量使用率。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 消息队列性能优化
RES12-04 出现问题后尽快恢复业务 - 云架构中心

出现问题后尽快恢复业务应用系统出现故障后，需要能尽快发现，尽快响应。风险等级高关键策略可以通过以下途径实现故障的快速发现：监控：应用系统需要提供业务监控信息，以便实时了解系统运行状态；维护团队需要有专人观测，并在发现故障发生时，需要及时响应。告警：应用系统在检测到故障后需要及

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
OPS01-02 规划标准化的运维组织 - 云架构中心

足够的数据用于后续的改进。例如一种运维组织设计是：将运维组织分为一线、二线和三线阶梯型运维支持团队，一线受理客户的服务请求，第一时间将大部分的服务请求闭环。二线处理一线升级的服务请求和监控发现的客户的问题，按照SLA完成闭环，涉及到软件版本缺陷类问题升级到三线进行解决，大部分时

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS01 建立持续改进的团队文化和标准化的运维体系
问题和检查项 - 云架构中心
问题和检查项 - 云架构中心

您是否使用考虑了不同的计费模式优化成本？ 1. 了解云上不同计费模式的特点 2. 为工作负载选择合适的计费模式 3. 跟踪并监控权益商品的使用情况 COST07 您是否管理了和优化了资源使用情况？ 1. 持续监控资源利用率指标 2. 释放闲置资源 3. 考虑不同的云资源技术选型 4. 降配低负载资源或升配高负载资源

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱
问题和检查项 - 云架构中心
问题和检查项 - 云架构中心

RES06您如何进行故障检测处理？故障模式分析面向所有故障进行检测支持亚健康检测 RES07 您如何监控应用系统资源？定义关键指标与阈值并监控日志统计监控监控到异常后发送消息通知监控数据存储和分析端到端跟踪请求消息 RES08 您如何减少依赖影响？减少强依赖项依赖采用松耦合

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

ySQL到MySQL单主灾备”）或双主灾备（详见“MySQL到MySQL双主灾备”）。监控告警配合CES服务，支持对RDS的CPU、内存、磁盘、网络等进行监控和告警。详见“支持的监控指标”。父主题： RDS云数据库

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > RDS云数据库
设计原则 - 云架构中心
设计原则 - 云架构中心

并持续稳定地运行，建议遵循以下设计原则。高可用设计单点故障会导致整个系统崩溃、主要功能受到影响、任务延误的系统轻度损坏或存在较大的故障隐患，因此系统的高可用设计非常关键。高可用设计的主要手段是冗余，甚至是多级冗余的组合，包括异地容灾方式保证灾难情况下无单点：冗余机制：只

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

），或双主灾备（详见“GaussDB(for MySQL)到GaussDB(for MySQL)双主灾备”）。监控告警配合CES服务，支持对GaussDB(for MySQL)的CPU、内存、磁盘、网络等进行监控和告警。详见“支持的监控指标”。父主题： GaussDB(for MySQL)云数据库

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > GaussDB(for MySQL)云数据库
OPS04-02 采用持续部署模型 - 云架构中心

实例在逻辑上彼此分离，以防止发生故障。风险等级高关键策略选择这两种模型时，部署的每个阶段之间的时间应该足够长，以便能够监控工作负载的运行状况指标。应该提供充足的部署间隔时间（即部署组之间的时间），以确保来自不同区域的用户或执行不同任务的用户有时间使用工作负载。间隔时间应以

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS04 自动化构建和部署流程
工作负载级参考架构 - 云架构中心

使用云备份归档服务防关键数据丢失安全运营使用安全云脑鸟瞰整个云上安全使用云日志、云审计、配置审计、云监控等服务管理云上资源使用威胁检测服务检测各类云服务日志中的恶意活动和未经授权行为使用云堡垒机接入运维父主题：参考架构

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 参考架构
选择合适网络服务资源 - 云架构中心

选择合适网络服务资源选择合适的网络服务资源是一个复杂的过程，需要考虑许多因素。以下提供了一些主要因素：评估合适网络云服务，主要考虑如下性能指标：网络流量：评估工作负载的预期网络流量，了解数据传输需求和网络请求的频率。带宽要求：确定工作负载的带宽要求，考虑通过网络传输和接收的数据量。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 ELB的并发连接数/新建连接数/带宽使用率过高检测：通过CES监控ELB的并发连接数/新建连接数/带宽使用率。恢复：根据业务情况，采用独享型负载均衡器，并手工调整ELB负载均衡器规格。父主题： ELB弹性负载均衡

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ELB弹性负载均衡

总条数： 206

上一页
1
2
3
4
5
...
11
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

常见故障模式 - 云架构中心

可靠性功能 - 云架构中心

信息管理类应用典型部署架构（99.95%） - 云架构中心

云运维中心(COC) - 云架构中心

COST08-02 云原生架构改造 - 云架构中心

人工智能性能优化 - 云架构中心

概念表 - 云架构中心

COST07-04 合理降配低负载资源或升配高负载资源 - 云架构中心

Kafka性能优化 - 云架构中心

RES12-04 出现问题后尽快恢复业务 - 云架构中心

OPS01-02 规划标准化的运维组织 - 云架构中心

问题和检查项 - 云架构中心

问题和检查项 - 云架构中心

可靠性功能 - 云架构中心

设计原则 - 云架构中心

可靠性功能 - 云架构中心

OPS04-02 采用持续部署模型 - 云架构中心

工作负载级参考架构 - 云架构中心

选择合适网络服务资源 - 云架构中心

常见故障模式 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线