搜索_华为云

常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

/内存/磁盘容量/磁盘IOPS/GPU/GPU缓存使用率过高检测：通过AOM监控CCE节点的CPU/内存/磁盘容量/磁盘IOPS/GPU/GPU缓存使用率。恢复：根据业务情况，手工变更节点规格或增加节点数量。 CCE工作负载的CPU /内存/GPU/GPU缓存使用率过高检测：通过

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > CCE云容器引擎
PERF03-02 选择合适规格的虚拟机和容器节点 - 云架构中心

开发、数据库等场景）主要消耗内存和存储维度的容量。存储密集型业务（如大型数据库、大数据分析、大规模文件存储、编译构建等场景）可能会比较消耗存储的带宽。根据业务的特征选择合适的虚拟机类型和规格。具体的虚拟机类型规格请参考官方文档。相关云服务和工具弹性云服务器 ECS 裸金属服务器

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适的计算资源
人工智能性能优化 - 云架构中心

该指标用于统计ModelArts用户服务的内存使用率。 gpu_util GPU使用率该指标用于统计ModelArts用户服务的GPU使用情况。 gpu_mem_usage GPU显存使用率该指标用于统计ModelArts用户服务的GPU显存使用情况。 npu_util NPU使用率

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
PERF02-02 容量规划 - 云架构中心

确定资源需求根据需求和预测分析的结果，进行容量评估和规划。确定系统所需的计算资源、存储资源和网络带宽等资源，以满足系统的性能要求。计算资源：根据预测的需求，计算所需的CPU、GPU、内存等计算资源，并根据实际情况进行选择和配置。存储资源：根据预测的需求，计算所需的存储空间，

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF02 性能规划 > 性能规划
选择合适的计算资源 - 云架构中心

评估计算要求涉及评估工作负载的特定计算需求，包括实例类型、可伸缩性和容器化等因素。不同的计算服务具有不同的功能和特征，可能会影响工作负载的性能。选择最佳计算服务以确保工作负载高效运行。请考虑以下策略：了解实例类型不同的实例类型针对不同的工作负载进行优化，例如CPU优化、内存优化和GPU优化，选择符合需求的实例类型。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模
PERF03-03 使用弹性伸缩 - 云架构中心

在低需求时段过度预配。虚拟机弹性伸缩和容器弹性伸缩都是实现应用自动化扩容和缩容的方式，但虚拟机弹性伸缩需要更多的资源和时间来启动和部署，而容器弹性伸缩可以更快速地响应变化，同时具有更高的资源利用率。虚拟机场景可以使用AS，容器场景充分考虑CA和HPA的弹性策略。使用容器时弹性策略可参考下面内容：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适的计算资源
SEC04-02 控制网络流量的访问 - 云架构中心

在设计网络拓扑时，仔细检查每个组件的连接要求，例如是否需要互联网可访问性（入站和出站）、连接到VPC的能力、边缘服务和外部数据中心等。除非资源必须接收来自公网的网络流量，否则不要将资源放置在VPC的公有子网中。对于入站和出站流量，应采用深度防御方法。例如对入站流量进行入侵检测、防范恶意的网络攻击。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC04 网络安全
什么是应用韧性 - 云架构中心
什么是应用韧性 - 云架构中心

）、外部攻击（如网络DDoS攻击超出预定限额流量）、外部依赖故障（如依赖系统访问超时或不可用）、地域灾难（如大面积停电、洪水）等，仍能提供和维持可接受的服务水平的能力，对系统至关重要。系统韧性设计主要涉及以下两个方面：确保系统具有高可用的架构，如无单点故障各种故障场景下的恢

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念
OPS02-02 关联源代码版本和部署的应用版本，使用代码质量最佳实践 - 云架构中心

关联源代码版本和部署的应用版本，使用代码质量最佳实践风险等级高关键策略在代码开发阶段，需要开展代码协作设计和管理。使用现代化的代码仓管理代码，确保代码合并后，代码将保持一致，并且不会丢失任何更改。通过正确的版本控制，同时，现代化的代码仓可以方便设置代码版本，关联源代码版本和部署的

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS02 通过CI/CD实现高效的频繁可逆的小规模变更
DMS分布式消息服务 - 云架构中心

DMS分布式消息服务支持以下各种消息类型： Kafka版：基于开源社区版Kafka提供的消息队列服务，向用户提供计算、存储和带宽资源独占式的Kafka专享实例。 RabbitMq版：完全兼容开源RabbitMQ，提供即开即用、消息特性丰富、灵活路由、高可用、监控和告警等特性，广泛应用于秒杀、流控、系统解耦等场景。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍
PERF03-06 选择合适的消息队列 - 云架构中心

先级队列等，适用于秒杀、流控、系统解耦等场景。详细版本对比可参考官方文档。相关云服务和工具：分布式消息服务Kafka版分布式消息服务RocketMQ版分布式消息服务RabbitMQ版父主题：选择合适的应用中间件云服务资源

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适的应用中间件云服务资源
RES08-02 依赖松耦合 - 云架构中心

可以独立地进行修改和扩展，而不影响其他组件；系统更加灵活，易于维护和升级，并且稳定性和可靠性也更强。风险等级中关键策略组件之间通过消息队列、消息缓存、负载均衡器等交互（即松耦合关系），可一定程度上屏蔽组件的状态变化，防止对其他组件造成影响相关云服务和工具弹性负载均衡服务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES08 依赖减少与降级
设计原则 - 云架构中心
设计原则 - 云架构中心

设计原则建立持续改进的团队文化和标准化运维体系在卓越运营中，团队文化建设至关重要。运营是一门不断改进的艺术。只有不断从已有事故中学习经验，持续学习和改进，才能最终达到卓越运营。故而，团队应该培养持续学习和改进的文化，此外，在事故发生时，应该以对事不对人的态度，思考系统的改进，

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱

总条数： 13

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

常见故障模式 - 云架构中心

PERF03-02 选择合适规格的虚拟机和容器节点 - 云架构中心

人工智能性能优化 - 云架构中心

PERF02-02 容量规划 - 云架构中心

选择合适的计算资源 - 云架构中心

PERF03-03 使用弹性伸缩 - 云架构中心

SEC04-02 控制网络流量的访问 - 云架构中心

什么是应用韧性 - 云架构中心

OPS02-02 关联源代码版本和部署的应用版本，使用代码质量最佳实践 - 云架构中心

DMS分布式消息服务 - 云架构中心

PERF03-06 选择合适的消息队列 - 云架构中心

RES08-02 依赖松耦合 - 云架构中心

设计原则 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线