搜索_华为云

RES07-04 监控数据存储和分析 - 云架构中心

并定期对其进行分析，以了解系统运行状态和趋势。风险等级中关键策略监控数据存储时长需要满足保留要求。监控数据需要定期分析，以便发现或预测系统故障，减少业务中断。相关云服务和工具 LTS云日志服务：支持日志分析与数据转储父主题： RES07 监控告警

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
双Region方案 - 云架构中心
双Region方案 - 云架构中心

支持业务运行状况、成功指标的检查，在发生故障时告警；支持ECS、DCS、Kafka、RDS、DDS等实例负载状态及资源故障切换等的监控，在负载超过阈值或状态异常时告警。弹性扩缩容支持自动弹性伸缩；针对ECS，通过ELB实现ECS实例的故障检测与负载均衡，并可通过AS监控负载随时添加和移除ECS实例来扩展应用系统的服务能力；针对RDS

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 电商类应用典型部署架构（99.99%）
可用度及SLO - 云架构中心
可用度及SLO - 云架构中心

可用性目标用于衡量应用系统的运行时间和停机时间，其表现形式为应用系统正常运行的时间占总时间（通常是一个月或一年）的百分比（如99.9%），即：可用度 = 可用时间 / 总时间 * 100% 常见的简单表达方式用“9”的数量或“9”的数量加“5”表示，如“三个9”表示“99.9%”，而“三个9一个5”表示“99

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念 > 可用性目标定义
RES11-04 灾难演练 - 云架构中心
RES11-04 灾难演练 - 云架构中心

通过容灾演练，可以验证灾备系统是否可用，且数据丢失时间以及恢复时间符合数据的RPO与RTO指标要求。风险等级高关键策略灾难演练着重测试服务跨AZ或跨Region故障转移能力，验证系统的容灾能力以及面对灾难时的应对能力，涉及到多个团队间配合，通常作为专项开展。容灾演练可以帮助企业更好的验

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
OPS01-02 规划标准化的运维组织 - 云架构中心

承载卓越运营，应该建立适应您实际的运维组织。运维组织的团队之间具有明确的流程，规定了团队之间的协作方式，例如规定不同团队的响应时间、服务级别目标（SLO) 或服务等级协议(SLA），同时应该记录团队间沟通信息，确保有足够的数据用于后续的改进。例如一种运维组织设计是：将运维组织分为一线、二线和三线

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS01 建立持续改进的团队文化和标准化的运维体系
COST03-03 公共成本分配 - 云架构中心

成本（包含CCE、ECS、EVS等服务成本）拆分到各个业务团队。以上公共成本，以及其他共享资源&平台服务&服务支持&未及时标记产生的未分配成本，也可以按照一定的比例规则，比如平均分配、按消费比例分配、按约定比例分配等规则，拆分到各个业务部门，从而满足各团队或业务部门公平分配公共成本的需求

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST03 对成本进行分配
SEC01-02 建立安全基线 - 云架构中心

建立安全基线建立符合合规性要求、行业标准和平台建议的安全基线，安全基线是团队内对安全的底线要求。根据基线定期衡量您的工作负载架构和运行情况，持续保持或改善工作负载的安全状况。风险等级高关键策略确定合规性要求：了解您的工作负载必须符合的组织、法律和合规性要求。相关云服务和工具华为云合规中心

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 云安全治理策略 > SEC01 云安全治理策略
PERF06-01 分层看护 - 云架构中心

分别设置不同梯度的性能看护指标。通常按照指标劣化程度可以设计成一般、紧急、重要三个梯度，对应每个梯度的指标配套对应的处理措施。对于敏感度或业务重要度的应用架构，可以新增一个提示级别的梯度。相关云服务和工具：云监控服务 CES 应用运维管理 AOM 应用性能管理APM 父主题：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF06 性能看护 > 性能看护
设计原则 - 云架构中心
设计原则 - 云架构中心

网络、数据等）受到保护，以确保其机密性、完整性和可用性。计算机系统安全的目标是保护信息系统免受未经授权的访问、使用、披露、破坏、修改、中断或不可用的威胁，同时确保信息系统能够持续地提供服务。系统安全的基本要素包括机密性、完整性、可用性、可审计、不可抵赖性等。其中最基本的三个要素

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱
RES08-03 减少被依赖项故障的影响 - 云架构中心

减少被依赖项故障的影响被依赖项自身的可用性需要增强，以减少对依赖它的组件的影响。风险等级中关键策略对于被依赖项本身，为减少由于服务故障或运行缓慢对依赖它的组件的影响，需要考虑使用以下技术和原则：减少被依赖项本身的外部依赖。优化性能，减少消息响应时延和负载。使用优先队列，

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES08 依赖减少与降级
RES03-03 对接容灾仲裁，支持自动切换 - 云架构中心

RES03-03 对接容灾仲裁，支持自动切换针对有状态的主备类型业务，在跨AZ部署并支持自动切换时，需要对接容灾仲裁，以避免出现双主或双备，从而在AZ间链路中断的情况下，业务能自动切换到一个AZ提供服务而不受影响；对于集群类业务不涉及。风险等级高关键策略面向有状态主备类

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾
内部知识管理类应用典型部署架构（99.9%） - 云架构中心

进行站点运行状态检查，在发生故障时告警；针对ECS、RDS实例负载状态进行监控，在资源过载时需要告警。弹性扩缩容针对内部用户场景，资源足够，无需自动弹性伸缩；针对ECS，通过ELB实现ECS实例的故障检测与负载均衡，并可根据ECS监控情况随时添加和移除ECS实例来扩展应用系统的服务能力；针

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
OPS07-03 支持事件管理 - 云架构中心

必须中心化，并且可供参与工作负载的任何人使用。如果没有wiki 或文档存储，可以使用源代码版本控制机制。优先通过自动化响应事件，避免占用业务交付和创新的时间。首先构建一个可重复的流程来缓解问题，然后关注自动缓解或解决根本问题以提升效率。华为云相关云服务和工具云监控服务 CES

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS07 进行故障分析和管理
SEC02-01 对账号进行保护 - 云架构中心

而是创建并使用IAM用户进行日常的管理操作。账号应仅用于关键操作，如创建新的IAM用户或修改权限。优先使用临时凭证并定期轮换凭证：定期更改账号的密码，并定期更新MFA设备。这有助于减少被猜测或盗用的风险。启用审计日志：启用审计日志功能，以监控账号的活动。审计日志可以帮助检测异常行为并及时采取措施。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC02 身份认证
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

/内存/磁盘/带宽使用率过高检测：通过CES监控CPU /内存/磁盘/带宽使用率。恢复：当CPU/内存使用高时，可根据业务情况，手工修改代理规格或增加代理数量以扩展资源。当磁盘使用率高时，可根据业务情况，修改实例存储空间支持更大存储空间。当带宽使用率高时，可根据业务情况，变更规格以支持更大带宽。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DMS分布式消息服务
SEC05-05 证书安全管理 - 云架构中心

证书进行更新或替换。避免使用过期证书，以防止安全漏洞和服务中断。安全存储：将证书存储在安全的位置，只允许授权人员访问。对私钥进行额外保护，如使用硬件安全模块（HSM）来存储私钥。加密传输：在证书的传输过程中使用加密通道，如SSL/TLS，以防止证书被篡改或窃取。避免

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC05 运行环境安全
PERF04-05 应用性能数据采集 - 云架构中心

PERF04-05 应用性能数据采集风险等级中关键策略应用程序的性能数据（吞吐量、延迟和完成时间），通常需要通过代码采集，例如嵌入代码片段或将工具集成到应用程序代码中。通过应用的性能数据，可以识别性能瓶颈、评估系统行为、识别可用性风险、规划容量等指标。常用应用性能监控策略有： APM

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 性能数据采集
SEC03-02 按需分配合适的权限 - 云架构中心

CP指定组织中成员账号的权限边界，限制账号内用户的操作。服务控制策略可以关联到组织、组织单元和成员账号。当服务控制策略关联到组织或组织单元时，该组织或组织单元下所有账号受到该策略影响。父主题： SEC03 权限管理

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC03 权限管理
基础概念 - 云架构中心
基础概念 - 云架构中心

不断验证和推动系统、工具、流程、人员能力的提升，从而提前发现并修复可避免的重大问题，或通过验证故障发现手段、故障修复能力来达到缩短故障修复时长的作用。运维托管运维托管服务是一种针对企业或组织的IT基础设施进行全面管理和维护的专业服务，旨在提高IT系统的可用性、可靠性和安全性

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
RES11-01 混沌测试 - 云架构中心
RES11-01 混沌测试 - 云架构中心

RES11-01 混沌测试混沌工程（Chaos Engineering）是通过故障注入的方式，触发或模拟实际故障，验证系统的稳定性和容错保护能力。风险等级高关键策略在真实环境中测试。作为CI/CD管道的一部分例行执行。主动注入故障，以便在问题发生前提前发现并解决问题。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试

总条数： 171

上一页
1
...
5
6
7
8
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

RES07-04 监控数据存储和分析 - 云架构中心

双Region方案 - 云架构中心

可用度及SLO - 云架构中心

RES11-04 灾难演练 - 云架构中心

OPS01-02 规划标准化的运维组织 - 云架构中心

COST03-03 公共成本分配 - 云架构中心

SEC01-02 建立安全基线 - 云架构中心

PERF06-01 分层看护 - 云架构中心

设计原则 - 云架构中心

RES08-03 减少被依赖项故障的影响 - 云架构中心

RES03-03 对接容灾仲裁，支持自动切换 - 云架构中心

内部知识管理类应用典型部署架构（99.9%） - 云架构中心

OPS07-03 支持事件管理 - 云架构中心

SEC02-01 对账号进行保护 - 云架构中心

常见故障模式 - 云架构中心

SEC05-05 证书安全管理 - 云架构中心

PERF04-05 应用性能数据采集 - 云架构中心

SEC03-02 按需分配合适的权限 - 云架构中心

基础概念 - 云架构中心

RES11-01 混沌测试 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线