搜索_华为云

RES07-01 定义关键指标与阈值并监控 - 云架构中心

迟和流量监控。 2、服务监控由于服务实例的冗余配置和应用系统的容错保护，业务指标正常并不意味着服务实例状态一定正常。例如，在配置了ELB的虚拟机集群中，ELB会主动隔离异常节点，虽然业务会在正常节点上分担，但应用系统实际已损失了部分处理容量。因此，云服务状态监控必不可少。云服

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

Pod将无法感知，也不会自动重启去恢复。最终导致虽然Pod状态显示正常，但Pod中的应用程序异常的情况。 Kubernetes提供了三种健康检查的探针：存活探针：livenessProbe，用于检测容器是否正常，类似于执行ps命令检查进程是否存在。如果容器的存活检查失败，集群会

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > CCE云容器引擎
OPS06-06 实施分布式跟踪 - 云架构中心

统的端到端请求流。风险等级高关键策略当系统出现问题时，需要能够追踪系统中每个组件的行为和交互情况。通过在系统中实现分布式跟踪，可以快速定位问题并进行有效的故障排除。设计建议链路跟踪可以通过在系统中添加跟踪标识符来实现。当请求进入系统时，标识符将被添加到请求中，并在整个

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

而导致业务无法运行。读写DCS概率性失败检测：读写失败。针对低概率超时错误，是Redis使用的正常现象。Redis使用受到网络传输、客户端设置超时时间等因素影响，可能出现单个请求超时问题。恢复：应用层进行重试，以应对暂时性故障，如DCS实例正在进行主备切换时；应用故障重试处理可参考“故障重试”。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

GaussDB(for MySQL)服务还支持异构容灾实例(MySQL节点)，支持在极端场景，如社区未知bug、用户误操作、AZ级故障导致服务无法正常提供服务等场景，可以快速将服务切换到异构容灾实例继续提供服务。详见“异构容灾实例”。数据备份和恢复 GaussDB(for MySQL)

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > GaussDB(for MySQL)云数据库
SEC10-02 制定事件响应计划 - 云架构中心

Response Plan, IRP）是组织安全策略的重要组成部分，它旨在确保在安全事件发生时，能够迅速、有序地采取行动，最大限度地减少损失，并尽快恢复正常运营。风险等级高关键策略建立事件响应计划，包括定义事件级别、响应流程和恢复策略。对服务可用性有影响或者租户可感知的安全事件划分为5个等级，S1/S2/S3/S4/S5。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC10 安全事件响应
OPS03-04 对生产环境进行拨测 - 云架构中心

面性能、端口性能、文件传输、音视频体验等场景进行周期性监控，支持多维度分析性能指标。利用可视化性能数据及时对业务质量作出反应，保证业务稳定正常运行。父主题： OPS03 完备的测试验证体系

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS03 完备的测试验证体系
云运维中心(COC) - 云架构中心
云运维中心(COC) - 云架构中心

变更审批：按照预设审批流程审批变更单，保障变更方案可靠性、时间合理性、流程合规性。风险评估：基于场景规则、流程规则、业务规则对变更进行管控，提前识别和拦截变更风险；通过变更日历实现变更冲突检测，降低服务间变更依赖导致的变更风险。实施保障：按预定方案执行变更，变更步骤标准化、可观测，变更异常

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
RES05-01 网络连接高可用 - 云架构中心

免在一条网络路径中断的情况下，业务能切换到其他路径继续通信。网络链路快速倒换：需要定期检查网络链路的连通性，但检测到失败时需要尽快切换到正常路径。公有云组网场景可通过多EIP 弹性IP及DNS域名解析实现网络连接的高可用；对可用性要求较高的场景，需要支持智能DNS功能，能对E

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES05 网络高可用
PERF04-03 性能测试步骤 - 云架构中心

若要为性能测试建立基线并将其用作未来性能测试的基准，请执行以下步骤：确定性能指标：确定要度量和约定的性能指标。示例包括：响应时间，或服务响应请求的速度。吞吐量，或按单位时间处理的请求数。资源利用率，例如CPU、内存和磁盘使用率。记录性能相关的度量值：将测试期间获得的性能指标记录为基线度量值。这些度量与测试前约定的SLA比较值。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 性能测试
可用度及SLO - 云架构中心
可用度及SLO - 云架构中心

可用度及SLO 可用性目标用于衡量应用系统的运行时间和停机时间，其表现形式为应用系统正常运行的时间占总时间（通常是一个月或一年）的百分比（如99.9%），即：可用度 = 可用时间 / 总时间 * 100% 常见的简单表达方式用“9”的数量或“9”的数量加“5”表示，如“三个9”表示“99

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念 > 可用性目标定义
组织级参考架构 - 云架构中心
组织级参考架构 - 云架构中心

理面向互联网的出入口和面向线下IDC机房的网络出入口网络管理团队 ER、DNS、NATG、EIP、VPC、DC、CC、VPN、CFW、WAF、AAD等安全云脑SecMaster、云审计服务CTS、配置审计Config 公共服务账号集中部署和管理企业的公共资源、服务和应用系统，并共享给其他所有成员账号使用

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 参考架构
PERF05-01 设计优化 - 云架构中心

得所有信息，减少交互次数。批处理把经常性的服务请求合并到一起，节省请求的初始化、传输、终止的处理开销。当请求的任务初始化、传输、终止的开销较大时，系统的额外开销可能超过真正的处理时间。通过将请求合并为批处理，开销处理为一批请求所分摊，不再是单独分别执行一次，从而提高处理效率。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF05 性能优化 > 设计优化
OPS04-04 自动化工程运维任务 - 云架构中心

优先考虑从自动化中受益最多的任务：专注于高度程序化且容易出现人为错误的任务：这些任务被明确定义，高度自动化，没有增加复杂性的变量，并且作为正常路径的一部分执行。示例包括：重新启动服务器、创建帐户以及将日志传输到数据存储。这些任务可能会按计划发生，作为对事件或监视警报的响应，或者根据外部因素的需要而发生。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS04 自动化构建和部署流程
基础概念 - 云架构中心
基础概念 - 云架构中心

to Know）平均诊断时长、MTTF（Mean Time to Fix）平均修复时长变更风险控制在变更作业过程中，建立事前检查、事中拦截和事后验证的能力，防止异常行为。安全生产安全生产目的是为了持续保障现网“安全、稳定、高质量”，从人员、工具、产品能力、流程规范等方面在

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
OPS01-02 规划标准化的运维组织 - 云架构中心

于后续的改进。例如一种运维组织设计是：将运维组织分为一线、二线和三线阶梯型运维支持团队，一线受理客户的服务请求，第一时间将大部分的服务请求闭环。二线处理一线升级的服务请求和监控发现的客户的问题，按照SLA完成闭环，涉及到软件版本缺陷类问题升级到三线进行解决，大部分时间处理告警、

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS01 建立持续改进的团队文化和标准化的运维体系
缓存性能优化 - 云架构中心
缓存性能优化 - 云架构中心

已经不再发展多DB特性，后续不建议依赖该特性。设置合理的内存淘汰（逐出）策略合理设置淘汰策略，可以在Redis内存意外写满的时候，仍然正常提供服务。强制 DCS默认的逐出策略为volatile-lru，请根据业务需求选择。Redis支持的数据逐出策略以缓存方式使用Redis

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
PERF04-05 应用性能数据采集 - 云架构中心

的工具，例如OpenTelemetry。建议：使用分布式的调用链技术，可以识别多个服务和组件之间请求链路；通过收集调用链数据实现数据流端到端的分析，产品阻塞瓶颈点或者效率低下的请求片段，从而进行针对性的优化。相关云服务和工具应用运维管理 AOM 应用性能管理 APM 云日志服务LTS

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 性能数据采集
RES07 监控告警 - 云架构中心
RES07 监控告警 - 云架构中心

RES07-02 日志统计监控 RES07-03 监控到异常后发送消息通知 RES07-04 监控数据存储和分析 RES07-05 端到端跟踪请求消息父主题：故障全面检测

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测
Serverless性能优化 - 云架构中心

预留实例是将函数实例的创建和释放交由用户管理，当您为某一函数创建了预留实例，函数工作流收到此函数的调用请求时，会优先将请求转发给您的预留实例，当请求的峰值超过预留实例处理能力时，剩余部分的请求将会转发给按量实例，由函数工作流自动为您分配执行环境。如果业务流量不均衡，存在波峰波谷情况，且对

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍

总条数： 68

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

RES07-01 定义关键指标与阈值并监控 - 云架构中心

可靠性功能 - 云架构中心

OPS06-06 实施分布式跟踪 - 云架构中心

常见故障模式 - 云架构中心

可靠性功能 - 云架构中心

SEC10-02 制定事件响应计划 - 云架构中心

OPS03-04 对生产环境进行拨测 - 云架构中心

云运维中心(COC) - 云架构中心

RES05-01 网络连接高可用 - 云架构中心

PERF04-03 性能测试步骤 - 云架构中心

可用度及SLO - 云架构中心

组织级参考架构 - 云架构中心

PERF05-01 设计优化 - 云架构中心

OPS04-04 自动化工程运维任务 - 云架构中心

基础概念 - 云架构中心

OPS01-02 规划标准化的运维组织 - 云架构中心

缓存性能优化 - 云架构中心

PERF04-05 应用性能数据采集 - 云架构中心

RES07 监控告警 - 云架构中心

Serverless性能优化 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线