搜索_华为云

常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 DCS的CPU /内存/带宽/连接数使用率过高检测：通过CES监控CPU /内存/带宽/连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。应用层进行过载保护，保障优先业务的运行，如将部分性能要求不高的业务切回到原始数据源。连接后端DCS失败检测：连接失败。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式云数据库 TaurusDB的CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率过高检测：通过CES监控CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。开启自动扩缩容，以便在过载时自动扩容规格和/或只读节点。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > 云数据库 TaurusDB云数据库
SEC10-02 制定事件响应计划 - 云架构中心

S3/S4/S5。实施持续的监控，包括云环境的日志、网络流量和异常行为。当检测到潜在事件时，进行初步分析以确定事件的性质和严重性。实施快速安全响应动作，隔离受影响的系统或账户、断开网络连接、停止服务、清除恶意文件、修复漏洞、替换受损系统并加固系统，确认所有威胁已经被完全清除，避免再次发生。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC10 安全事件响应
RES14-02 自动化变更 - 云架构中心

自动化测试和验证：验证变更的正确性以及性能、可靠性影响，减少人工测试的错误和延迟。监控和审计变更过程：追踪和记录变更执行情况，及时发现和解决问题，提供透明度和可追溯性。相关云服务和工具云运维中心 COC：作业管理：提供用户自定义作业的创建、修改、删除以及在目标虚拟机上执行

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES14 配置防差错
OPS01 建立持续改进的团队文化和标准化的运维体系 - 云架构中心

OPS01 建立持续改进的团队文化和标准化的运维体系 OPS01-01 建立持续学习和改进的文化 OPS01-02 规划标准化的运维组织 OPS01-03 规划标准化的运维流程和运维工具父主题：卓越运营支柱

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
金融类核心应用典型部署架构（99.999%） - 云架构中心

定期进行演练，及时发现问题。根据以上方案，典型部署架构如下：该架构的主要特点包括：应用系统采用无状态应用+有状态数据库的分层部署架构。应用系统在两个Region各部署一套完整系统，Region内跨AZ高可用部署，提供同城跨数据中心双活能力；Region间数据单元化部署，实

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

tMQ实例、实例节点、实例队列进行监控和告警等进行监控和告警。详见“支持的监控指标”。 RocketMQ：配合CES服务，支持对RocketMQ实例、实例节点、实例队列、实例消费组、实例队列消费组、实例的死信队列进行监控和告警。详见“支持的监控指标”。父主题： DMS分布式消息服务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DMS分布式消息服务
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 OBS桶流量过载检测：通过CES监控请求数、请求成功率、上传/下载带宽等流量指标。恢复：应用层调整批量业务，避免业务高峰期进行备份等业务；应用层进行重试，以应对暂时性故障，如网络拥塞；应用故障重试处理可参考“故障重试”。应用层进行过载保护，保障优先业务的运行。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > OBS对象存储服务
PERF03-02 选择合适规格的虚拟机和容器节点 - 云架构中心

服务器资源就类似一块块资源拼成的木桶，其最多能承载的业务需求取决于哪一块资源最先达到瓶颈。不同应用对资源需求不同，例如：功耗密集型业务（如高性能计算、人工智能、深度学习等场景）主要就是消耗计算维度的容量。内存密集型业务（如大数据处理、图像/视频处理、游戏开发、数据库等场景）主要消耗内存和存储维度的容量。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适的计算资源
PERF04-04 资源性能数据收集 - 云架构中心

了解工作负载的运行状况和行为。指标作用：帮助你了解资源的运行状况和性能，在云监控平台上配置对应的告警策略和配置指标看板。通过跟踪分析网络路径上的流量来优化网络性能。相关云服务和工具云监控服务 CES 父主题：性能数据采集

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 性能数据采集
更多参考文档 - 云架构中心
更多参考文档 - 云架构中心

更多参考文档确定性运维白皮书父主题：卓越运营支柱

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
云堡垒机(CBH) - 云架构中心
云堡垒机(CBH) - 云架构中心

云堡垒机提供云计算安全管控的系统和组件，包含部门、用户、资源、策略、运维、审计等功能模块，集单点登录、统一资产管理、多终端访问协议、文件传输、会话协同等功能于一体。通过统一运维登录入口，基于协议正向代理技术和远程访问隔离技术，实现对服务器、云主机、数据库、应用系统等云上资源的集中管理和运维审计。父主题：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
PERF03-03 使用弹性伸缩 - 云架构中心

、每周、每月或每年的具体时间点）。 CustomedHPA策略 Prometheus Prometheus（停止维护）云原生监控插件一套开源的系统监控报警框架，负责采集kubernetes集群中kubelet的公开指标项（CPU利用率、内存利用率）。 NA CronHPA CCE容器弹性引擎

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适的计算资源
OPS06-07 通过可观测性指标引入自动化措施 - 云架构中心

OPS06-07 通过可观测性指标引入自动化措施风险等级高关键策略可观测与自动化运维工具联动，实现自动化的故障检测、恢复及弹性伸缩等功能，进一步提升运维响应速度和准确性，降低人为干预带来的延误，甚至错误。父主题： OPS06 可观测性体系

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
COST04-01 建立规范，持续提升成本分配比例 - 云架构中心

COST04-01 建立规范，持续提升成本分配比例风险等级中关键策略成本是否准确有效的分配，是后续进行成本监控和优化的基础。客户应关注并提升成本分配比例，奠定成本治理的基础。标签作为一种常见的成本分配方式，可以灵活匹配组织内多种分配场景（比如产品、应用、责任人），但在实

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST04 持续进行成本治理
成本优化云服务介绍 - 云架构中心

成本优化云服务介绍成本中心是华为云免费向用户提供的云财务管理服务，可帮助您收集华为云成本和使用量的相关信息、探索和分析华为云成本使用情况、监控和跟踪华为云成本，及时了解云支出的趋势和动因，减少异常支出，持续成本优化。费用中心为您提供财务信息、发票、合同、续费、退订和变更等服务，

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱
RES15-04 灰度部署和升级 - 云架构中心

原地升级和回滚时，升级和回滚过程中业务将会中断，中断时长受限于升级和回滚的时长，对业务影响比较大；而采用灰度部署和升级，可减少升级和回滚过程中的业务中断，提升系统可用性。风险等级高关键策略通过金丝雀部署、蓝绿部署等方式实现灰度升级或部署，逐步引入新版本部署范围或切换用户流量，配合自动回退以降低部署差错导致业务中断的风险。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES15 升级不中断业务
PERF02-02 容量规划 - 云架构中心

确定系统所需的计算资源、存储资源和网络带宽等资源，以满足系统的性能要求。计算资源：根据预测的需求，计算所需的CPU、GPU、内存等计算资源，并根据实际情况进行选择和配置。存储资源：根据预测的需求，计算所需的存储空间，例如需要存储大量的数据，可能需要选择分布式存储系统。网络

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF02 性能规划 > 性能规划
OPS01-01 建立持续学习和改进的文化 - 云架构中心

次发生的可能性和影响，这些流程和自动化工具，也需要广而告之，以向团队解释清楚缘由。父主题： OPS01 建立持续改进的团队文化和标准化的运维体系

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS01 建立持续改进的团队文化和标准化的运维体系
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

OBS支持跨区域复制，能够为用户提供跨区域数据容灾的能力，满足用户数据复制到异地进行备份的需求。监控告警配合CES服务，支持对OBS桶的请求、流量、时延和错误响应等进行监控和告警。详见“监控对象存储服务”。父主题： OBS对象存储服务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > OBS对象存储服务

总条数： 255

上一页
1
...
5
6
7
...
13
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

SEC10-02 制定事件响应计划 - 云架构中心

RES14-02 自动化变更 - 云架构中心

OPS01 建立持续改进的团队文化和标准化的运维体系 - 云架构中心

金融类核心应用典型部署架构（99.999%） - 云架构中心

可靠性功能 - 云架构中心

常见故障模式 - 云架构中心

PERF03-02 选择合适规格的虚拟机和容器节点 - 云架构中心

PERF04-04 资源性能数据收集 - 云架构中心

更多参考文档 - 云架构中心

云堡垒机(CBH) - 云架构中心

PERF03-03 使用弹性伸缩 - 云架构中心

OPS06-07 通过可观测性指标引入自动化措施 - 云架构中心

COST04-01 建立规范，持续提升成本分配比例 - 云架构中心

成本优化云服务介绍 - 云架构中心

RES15-04 灰度部署和升级 - 云架构中心

PERF02-02 容量规划 - 云架构中心

OPS01-01 建立持续学习和改进的文化 - 云架构中心

可靠性功能 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线