搜索_华为云

应用管理与运维平台(ServiceStage) - 云架构中心

应用管理与运维平台(ServiceStage) 应用管理与运维平台（ServiceStage）是面向企业的应用管理与运维平台，提供应用发布、部署、监控与运维等一站式解决方案。支持Java、Php、Python、Node.js、Docker、Tomcat技术栈。支持Apache ServiceComb

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
RES04-02 部署容灾系统以满足容灾目标 - 云架构中心

n主备容灾能力的实施步骤建议如下：选择另一个Region作为灾备Region，部署一套相同的应用系统，包括工作负载、数据库实例等。针对应用系统内的关键数据，利用云服务或应用系统自身实现跨Region的数据复制。若云服务实例支持跨Region容灾，则配置生产站点与灾备Regi

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
RES06-03 支持亚健康检测 - 云架构中心

RES06-03 支持亚健康检测系统内组件有可能完全故障，也有可能处于亚健康状态；亚健康是指系统整体业务未超标，但系统中局部实例业务超标。亚健康更多是个相对概念，相对历史表现的统计，或相对系统整体。因此针对亚健康的检测和判断有所不同。当处于亚健康状态时，系统也需要及时进行隔离或恢复处理，避免对业务造成影响。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES06 故障检测
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 ECS的CPU /内存/磁盘容量/磁盘IOPS使用率过高检测：通过CES监控CPU/内存/磁盘容量/磁盘IOPS使用率。恢复：根据业务情况，手工变更规格以扩展资源或增加ECS实例进行负荷分担。对于无状态业务，启动AS弹性伸缩，自动扩展资源。应用层进行过载保护，保障优先业务的运行。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ECS弹性云服务器
OPS06-01 建立可观测性体系 - 云架构中心

可观测性（observability）最初是系统理论中的一个概念，指系统的状态能否被外部观察到和重现。随着云原生、微服务架构的发展，IT系统对可观测性的需求日益增强。业界对可观测性的定义：通常是指基于对复杂系统外部输出的了解，能够了解其内部状态或状况的程度。系统越可观测，定位问题根本原因的过程

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 BMS的CPU /内存/磁盘容量/磁盘IOPS使用率过高检测：通过CES监控CPU/内存/磁盘容量/磁盘IOPS使用率恢复：根据业务情况，更换规格更高的BMS实例或增加BMS实例进行负荷分担。应用层进行过载保护，保障优先业务的运行。连接后端BMS失败检测：网络连接失败。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > BMS裸金属服务
PERF03-11 选择合适的非关系型数据库 - 云架构中心

场景一：基于兼容性原则考虑平滑上云，上云前系统中数据库的选型已经过业务实践的检验，建议选取生态相同的关系型数据库服务进行平替，避免出现数据库层与应用层不兼容或数据库切换对业务架构中其他组件产生负面影响。场景二：基于场景评估如果是在云上新建业务系统或基于同数据库不同服务中选取时，建议

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适的数据库资源
RES04-01 定义应用系统的容灾目标RPO与RTO - 云架构中心

RES04-01 定义应用系统的容灾目标RPO与RTO 在进行容灾设计前，需要根据应用系统的重要性，明确其容灾目标，通常以RPO和RTO指标来定义： RPO：允许的数据丢失量，与数据的周期性复制周期或连续性复制延时相关。 RTO：允许的业务恢复时长，即业务中断时长，与灾备端业务的部署与切换方式相关。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
双Region方案 - 云架构中心
双Region方案 - 云架构中心

支持自动弹性伸缩；针对ECS，通过ELB实现ECS实例的故障检测与负载均衡，并可通过AS监控负载随时添加和移除ECS实例来扩展应用系统的服务能力；针对RDS for MySQL，可根据负载监控情况，自动扩缩规格或增删只读节点。变更防差错软件更新采用金丝雀或蓝绿部署，部署过程自动完成，在部署过程中出现问题时自动回滚。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 电商类应用典型部署架构（99.99%）
PERF03-02 选择合适规格的虚拟机和容器节点 - 云架构中心

服务器资源就类似一块块资源拼成的木桶，其最多能承载的业务需求取决于哪一块资源最先达到瓶颈。不同应用对资源需求不同，例如：功耗密集型业务（如高性能计算、人工智能、深度学习等场景）主要就是消耗计算维度的容量。内存密集型业务（如大数据处理、图像/视频处理、游戏开发、数据库等场景）主要消耗内存和存储维度的容量。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适的计算资源
问题和检查项 - 云架构中心
问题和检查项 - 云架构中心

RES06您如何进行故障检测处理？故障模式分析面向所有故障进行检测支持亚健康检测 RES07 您如何监控应用系统资源？定义关键指标与阈值并监控日志统计监控监控到异常后发送消息通知监控数据存储和分析端到端跟踪请求消息 RES08 您如何减少依赖影响？减少强依赖项依赖采用松耦合

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

健康检查。详见“修改健康检查配置”。跨AZ容灾配合ELB服务，可以实现跨AZ的故障切换。监控告警配合CES服务，支持对BMS的CPU、内存、磁盘、网络等进行监控和告警。详见“监控指标说明”。父主题： BMS裸金属服务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > BMS裸金属服务
RES13-02 应用系统负载均衡，避免流量不均匀 - 云架构中心

RES13-02 应用系统负载均衡，避免流量不均匀针对无状态集群业务，通过负载均衡来保证业务均匀分发，可避免部分组件空闲，而部分组件过载而影响业务；同时还可以充分利用系统资源，提高系统性能，改善系统可靠性。风险等级高关键策略负载均衡分发业务粒度需避免过大，而导致部分组件过载。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 CPU /内存/磁盘/带宽使用率过高检测：通过CES监控CPU /内存/磁盘/带宽使用率。恢复：当CPU/内存使用高时，可根据业务情况，手工修改代理规格或增加代理数量以扩展资源。当磁盘使用率高时，可根据业务情况，修改实例存储空间支持更大存储空间。当带宽使用

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DMS分布式消息服务
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 RDS的CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率过高检测：通过CES监控CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。开启存储空间自动扩容，以便在磁盘容量不足时自动扩容。应用层进行过载保护，保障优先业务的运行。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > RDS云数据库
数据库性能优化 - 云架构中心
数据库性能优化 - 云架构中心

观测性能指标实践性能监控有助于实时了解业务和系统的负载情况以及资源使用情况，结合告警规则的设置，云服务可自动对负载异常部分进行告警，以便更好地使用和维护云数据库系统。以GeminiDB 为例，您可以通过管理控制台，直观地查看GeminiDB Redis的各项监控指标。 3.设置数据分区实践

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
设计原则 - 云架构中心
设计原则 - 云架构中心

分层保护：系统故障保护要考虑网络分层，下层的故障保护倒换要比上层灵敏，防止系统出现乒乓倒换。通过检测系统运行状态，或监控系统载关键指标，来判断系统是否发生故障，并针对故障可进行自动恢复处理。可以通过故障分析方法分析各种故障模式、影响及危害，设计对应的可靠可用方案，提供冗余、隔

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
应用运维管理(AOM2.0) - 云架构中心

应用运维管理（Application Operations Management，简称AOM）是云上应用的一站式立体化运维管理平台，融合云监控、云日志、应用性能、真实用户体验、后台链接数据等多维度可观测性数据源，提供应用资源统一管理、一站式可观测性分析和自动化运维方案，帮助用户及

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
OPS06-03 制定和实施可观测性指标 - 云架构中心

设计建议整体技术方案会变成标准并进行发布，各个业务系统架构师在设计时遵循这套标准，这样可以保证能力能够从设计态开始，包括运行态、高可用架构等场景中得到应用。可观测指标可以通过监控工具来实现，并允许在发生异常时发送警报。有很多监控工具可以使用，例如Prometheus、Grafa

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

ELB支持后端服务器多AZ部署，当某个AZ出现故障时，ELB仍可将流量转发到其他AZ的后端ECS处理，提高应用系统容灾能力。监控告警配合CES服务，支持对ELB的连接数、带宽、错误响应等进行监控和告警。详见“监控指标说明”。父主题： ELB弹性负载均衡

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ELB弹性负载均衡

总条数： 240

上一页
1
2
3
4
5
...
12
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

应用管理与运维平台(ServiceStage) - 云架构中心

RES04-02 部署容灾系统以满足容灾目标 - 云架构中心

RES06-03 支持亚健康检测 - 云架构中心

常见故障模式 - 云架构中心

OPS06-01 建立可观测性体系 - 云架构中心

常见故障模式 - 云架构中心

PERF03-11 选择合适的非关系型数据库 - 云架构中心

RES04-01 定义应用系统的容灾目标RPO与RTO - 云架构中心

双Region方案 - 云架构中心

PERF03-02 选择合适规格的虚拟机和容器节点 - 云架构中心

问题和检查项 - 云架构中心

可靠性功能 - 云架构中心

RES13-02 应用系统负载均衡，避免流量不均匀 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

数据库性能优化 - 云架构中心

设计原则 - 云架构中心

应用运维管理(AOM2.0) - 云架构中心

OPS06-03 制定和实施可观测性指标 - 云架构中心

可靠性功能 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线