搜索_华为云

云监控中心(CES) - 云架构中心
云监控中心(CES) - 云架构中心

使您全面了解云上的资源使用情况、业务的运行状况，并及时收到异常告警做出反应，保证业务顺畅运行。云监控服务主要具有以下功能：自动监控：云监控服务不需要开通，在创建弹性云服务器等资源后监控服务会自动启动，您可以直接到云监控服务查看该资源运行状态并设置告警规则。主机监控：通过在弹

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

当BMS由于过载导致网络限制时，可参考“BMS的CPU /内存/磁盘容量/磁盘IOPS使用率过高”的处理。 BMS实例不可用或运行异常检测：配置ELB弹性负载均衡器的后端服务器健康检查，以便定期检查后端服务器的运行状态。健康检查应检查关键功能是否能正确响应。恢复：针对每个应用层，配置多个BMS实例，通过EL

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > BMS裸金属服务
OPS03-02 使用多个环境进行集成测试，构建和生产环境相同的预生产环境 - 云架构中心

不同团队代码之间的业务交互流程是否正确。但是测试环境和生产环境的配置不尽相同。而预生产环境使用与生产环境相同的部署配置、安全控制、步骤和程序，在预生产环境中测试发布过程。验证所有部署步骤是否按预期完成，如检查依数据、配置和服务。通过集成功能测试，和各种非功能测试以及运行状况检查等各种监控方法，进一步测试所有更改。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS03 完备的测试验证体系
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

检测：通过CES监控CPU /内存/带宽/连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。应用层进行过载保护，保障优先业务的运行，如将部分性能要求不高的业务切回到原始数据源。连接后端DCS失败检测：连接失败。恢复：应用层进行重试，以应对暂时性故障，如DCS实

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
PERF04-04 资源性能数据收集 - 云架构中心

每个华为云提供的云服务都有一组特定于资源功能的指标，用于呈现有关资源的使用情况。通过收集资源性能数据，可以深入了解工作负载的运行状况和行为。指标作用：帮助你了解资源的运行状况和性能，在云监控平台上配置对应的告警策略和配置指标看板。通过跟踪分析网络路径上的流量来优化网络性能。相关云服务和工具

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 性能数据采集
可用度及SLO - 云架构中心
可用度及SLO - 云架构中心

可用度及SLO 可用性目标用于衡量应用系统的运行时间和停机时间，其表现形式为应用系统正常运行的时间占总时间（通常是一个月或一年）的百分比（如99.9%），即：可用度 = 可用时间 / 总时间 * 100% 常见的简单表达方式用“9”的数量或“9”的数量加“5”表示，如“三个9”表示“99

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念 > 可用性目标定义
PERF05 性能优化 - 云架构中心
PERF05 性能优化 - 云架构中心

性能优化工作中，需警惕“过早优化”的问题。我们的基本指导策略还是首先让系统运行起来，再考虑怎么让它变得更快。一般只有在我们证实某部分代码的确存在一个性能瓶颈的时候，才应进行优化。除非用专门的工具分析瓶颈，否则很有可能是在浪费自己的时间。另外，性能优化的隐含代价会使我们的代码变得难于理解和维护，这一点也是需要权衡和关注的。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱
SEC01-03 梳理资产清单 - 云架构中心

给资源打上标签，从而在出现安全事件时，能快速定位到有安全风险的资源。风险等级高关键策略设计态与运行态一致性：对照设计态的架构图、架构文档实施云服务资源。工作负载运行时的架构始终保持与设计态一致。自动化资产盘点：使用安全云服务或工具来自动发现和记录云上资源，包括主机、存

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 云安全治理策略 > SEC01 云安全治理策略
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

后端服务器健康检查 ELB弹性负载均衡支持定期向后端服务器发送请求以测试其运行状态。当判断后端服务器健康检查异常后，就不会将流量分发到异常后端服务器，而是分发到健康检查正常的后端服务器，从而提高了业务的可靠性。当异常的后端服务器恢复正常运行后，负载均衡器会将其自动恢复到负载均衡服务中，承载业务流量。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ELB弹性负载均衡
RES15-02 自动化检查 - 云架构中心

在部署或升级过程中集成基本测试功能，在部署或升级完成后自动进行检查和测试，以验证新部署的代码功能是否正确。在部署或升级过程中集成故障注入测试功能，在部署或升级完成后自动注入故障进行测试，以验证新部署代码的韧性。父主题： RES15 升级不中断业务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES15 升级不中断业务
设计原则 - 云架构中心
设计原则 - 云架构中心

失败时发生大规模问题的风险。 X即代码，尽量自动化所有流程云上应用和传统应用的一大区别是，您可以将整个云上应用，包含应用程序自身、运行应用的云基础设施、安全策略、以及相应的运维操作视为代码。这意味着整个卓越运营的各种实践，都可以极大地使用代码自动化，例如定义应用的基础设施，部署

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
OPS03-03 进行性能压测 - 云架构中心

境产生负载，使测试环境处于极限状态下并长时间连续运行，以测试硬件设备或云服务在高负载情况下是否能够稳定工作。压力测试强调在极端情况下系统的稳定性。容量测试：指在一定的软件、硬件及网络环境下，构造不同数量级别的测试数据及记录，运行一种或多种业务，在一定虚拟用户数量的情况下，获取不

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS03 完备的测试验证体系
RES14-04 提供runbook进行标准化变更 - 云架构中心

RES14-04 提供runbook进行标准化变更 runbook是指运行手册，是用来实现变更的详细操作过程。变更前需提供标准化runbook用于变更和回退，变更过程中严格按照runbook执行，在变更失败时根据runbook进行回退。风险等级高关键策略 runbook需

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES14 配置防差错
RES15-01 自动化部署和升级 - 云架构中心

RES15-01 自动化部署和升级部署和升级过程由代码实现，以固化部件间依赖、安装和配置过程，减少人工错误。风险等级高关键策略部署和升级过程自动化完成。父主题： RES15 升级不中断业务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES15 升级不中断业务
OPS07-03 支持事件管理 - 云架构中心

流程中需要回答的问题，并需要获得可靠的响应过程。流程必须中心化，并且可供参与工作负载的任何人使用。如果没有wiki 或文档存储，可以使用源代码版本控制机制。优先通过自动化响应事件，避免占用业务交付和创新的时间。首先构建一个可重复的流程来缓解问题，然后关注自动缓解或解决根本问题以提升效率。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS07 进行故障分析和管理
OPS03-04 对生产环境进行拨测 - 云架构中心

能、端口性能、文件传输、音视频体验等场景进行周期性监控，支持多维度分析性能指标。利用可视化性能数据及时对业务质量作出反应，保证业务稳定正常运行。父主题： OPS03 完备的测试验证体系

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS03 完备的测试验证体系
基础概念 - 云架构中心
基础概念 - 云架构中心

、影响范围及故障恢复时间做到可防、可控、可治，要把数字化带来的“不确定性”通过运维变成“确定性”。 IaC 基础设施即代码基础设施即代码（IaC）是指使用代码而不是手动流程和设置来配置和支持基础设施的能力。任何应用程序环境都需要许多基础设施组件，例如操作系统、数据库连接和存储。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

当ECS由于过载导致网络限制时，可参考“ECS的CPU /内存/磁盘容量/磁盘IOPS使用率过高”的处理。 ECS实例不可用或运行异常检测：配置ELB弹性负载均衡器的后端服务器健康检查，以便定期检查后端服务器的运行状态。健康检查应检查关键功能是否能正确响应。恢复：针对每个应用层，配置多个ECS实例，通过EL

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ECS弹性云服务器
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

恢复：根据业务情况，手工变更规格以扩展资源。开启存储空间自动扩容，以便在磁盘容量不足时自动扩容。应用层进行过载保护，保障优先业务的运行。连接后端RDS失败检测：连接失败。恢复：应用层进行重试，以应对暂时性故障，如RDS实例正在进行主备切换时；应用故障重试处理可参考“故障重试”。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > RDS云数据库
OPS02-01 进行需求管理和迭代开发 - 云架构中心

OPS02-01 进行需求管理和迭代开发风险等级高关键策略您的云上应用要达到卓越运营，从设计和开发阶段就需要保证可用性，可恢复性，同时也需要保证代码的质量。您需要评估和了解软件DFX相关要求，包括可靠性、性能、可服务性、可运维性、可交付性等要求将监管、行业和内部合规性要求纳入需求范围

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS02 通过CI/CD实现高效的频繁可逆的小规模变更

总条数： 266

上一页
1
2
3
4
5
...
14
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

云监控中心(CES) - 云架构中心

常见故障模式 - 云架构中心

OPS03-02 使用多个环境进行集成测试，构建和生产环境相同的预生产环境 - 云架构中心

常见故障模式 - 云架构中心

PERF04-04 资源性能数据收集 - 云架构中心

可用度及SLO - 云架构中心

PERF05 性能优化 - 云架构中心

SEC01-03 梳理资产清单 - 云架构中心

可靠性功能 - 云架构中心

RES15-02 自动化检查 - 云架构中心

设计原则 - 云架构中心

OPS03-03 进行性能压测 - 云架构中心

RES14-04 提供runbook进行标准化变更 - 云架构中心

RES15-01 自动化部署和升级 - 云架构中心

OPS07-03 支持事件管理 - 云架构中心

OPS03-04 对生产环境进行拨测 - 云架构中心

基础概念 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

OPS02-01 进行需求管理和迭代开发 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线