搜索_华为云

RES11-01 混沌测试 - 云架构中心
RES11-01 混沌测试 - 云架构中心

RES11-01 混沌测试混沌工程（Chaos Engineering）是通过故障注入的方式，触发或模拟实际故障，验证系统的稳定性和容错保护能力。风险等级高关键策略在真实环境中测试。作为CI/CD管道的一部分例行执行。主动注入故障，以便在问题发生前提前发现并解决问题。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
RES12-05 应急恢复回溯 - 云架构中心

RES12-05 应急恢复回溯在业务进行应急恢复处理后，需要对事件进行回溯并进行优化，以避免故障的再次发生。风险等级高关键策略对问题进行定位和修复，优化产品能力，减少同类事件的发生。针对应急恢复过程进行总结，优化恢复过程。父主题： RES12 应急恢复处理

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

可靠性功能集群HA ELB采用集群化部署，支持多可用区的同城多活容灾，无缝实时切换。后端服务器健康检查 ELB弹性负载均衡支持定期向后端服务器发送请求以测试其运行状态。当判断后端服务器健康检查异常后，就不会将流量分发到异常后端服务器，而是分发到健康检查正常的后端服务器，从而提高了业务的可靠性

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ELB弹性负载均衡
COST08-02 云原生架构改造 - 云架构中心

COST08-02 云原生架构改造风险等级中关键策略基于云原生架构改造，主要是应用容器化和微服务化的改造，从而发挥云原生的优势，如：自动弹性扩缩容等，容器技术可以提高资源利用率，避免闲置资源，从而降低计算成本，应用微服务化可以降低运维复杂度，从而降低运维成本。广告电商等在线作业服务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST08 进行架构优化
OPS08-03 知识管理 - 云架构中心
OPS08-03 知识管理 - 云架构中心

一般通过运维知识库系统承载，运维人员可以轻松地查找和获取各种运维知识，包括网络配置、服务器管理、数据库维护等方面的知识。下面将介绍运维知识库系统的五个主要功能和优势。丰富的知识资源：运维知识库系统收集整理了大量的运维知识和经验，涵盖了各个领域和层次的内容。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS08 度量运营状态和持续改进
通过AOM助力系统运维能力提升，降低运维成本与难度 - 云架构中心

通过AOM助力系统运维能力提升，降低运维成本与难度某平台服务的认证驾驶员用户1000万人，货主用户500万人，集团业务覆盖全国339个主要城市，覆盖线路数量超过11万条，实现了全国多中心运营的架构。客户痛点：多云双活场景运维难保障：大规模集群场景，单个云厂商灾备不足以保障业务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 参考案例
PERF02-01 定义性能目标 - 云架构中心

PERF02-01 定义性能目标风险等级中关键策略建立性能目标是实现工作负载性能效率的重要步骤。性能目标定义了工作负载所需的性能级别，并帮助衡量实现这些目标的有效性。性能目标提供了衡量和比较工作负载效率的基准。此基准可帮助你突出显示改进领域。这些目标还使任务与组织的目标保持一致

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF02 性能规划 > 性能规划
OPS06-01 建立可观测性体系 - 云架构中心

OPS06-01 建立可观测性体系可观测性（observability）最初是系统理论中的一个概念，指系统的状态能否被外部观察到和重现。随着云原生、微服务架构的发展，IT系统对可观测性的需求日益增强。业界对可观测性的定义：通常是指基于对复杂系统外部输出的了解，能够了解其内部状态或状况的程度

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
RES01-02 应用组件多位置部署 - 云架构中心

RES01-02 应用组件多位置部署应用组件需要部署在多个数据中心，以避免单个数据中心故障而导致业务中断。风险等级高关键策略可根据不同需求，将应用的数据和资源部署在多个位置：应用多AZ部署：应用应尽可能部署在多个可用区，避免由于单个可用区故障而导致所有业务中断。应用多

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES01 冗余
RES11-03 长稳测试 - 云架构中心
RES11-03 长稳测试 - 云架构中心

RES11-03 长稳测试基于用户使用场景构建业务模型，自动化构建覆盖系统容量规格70%的业务量，持续7*24小时进行长时间负载测试以评估系统稳定性。风险等级高关键策略模拟各种业务场景进行测试。持续自动测试。测试结果发生偏差时自动告警，以便及时定位和处理。父主题：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
RES12-01 组建应急恢复团队 - 云架构中心

RES12-01 组建应急恢复团队为了应对紧急故障场景，需要组建应急恢复团队，明确责任人，并进行培训。风险等级高关键策略组建应急恢复团队：其中包括应急恢复主席及所有组件及关键依赖项的恢复责任人。应急恢复主席：在出现问题后及时组织应急恢复团队进行快速恢复处理。组件或关键依赖项运维责任人

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

可靠性功能集群HA Kafka实例通过副本冗余方式实现实例容灾，当检测到leader副本故障后，快速完成副本选主，保障Kafka实例持续提供服务。 RabbitMQ集群提供镜像队列，通过镜像在其他节点同步数据。单节点宕机时，仍可通过唯一的访问地址对外提供服务。 RocketMQ使用一主两备架构

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DMS分布式消息服务
RES01-01 应用组件高可用部署 - 云架构中心

相关云服务和工具弹性云服务器 ECS 裸金属服务器 BMS 弹性负载均衡 ELB 云容器引擎 CCE 文档数据库服务 DDS 分布式缓存服务 DCS MapReduce服务 MRS 父主题： RES01 冗余

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES01 冗余
RES07-02 日志统计监控 - 云架构中心

RES07-02 日志统计监控应用系统需要收集日志，在必要时对日志进行统计分析，设置告警规则触发告警，统计分析的内容可以是统计一定时间段内某些关键字出现的次数。风险等级中关键策略日志关键字与出现次数阈值需要合理设置，以免监控信息不正确。日志信息（如关键字或出现频率）发生变化时

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
RES08-02 依赖松耦合 - 云架构中心

RES08-02 依赖松耦合系统内组件之间直接访问时，会产生紧耦合关系一个组件的状态变化会对其他组件产生直接影响，从而会导致所有组件的可用性均下降。而采用松耦合架构时，各个组件之间的依赖关系非常弱，它们可以独立地进行修改和扩展，而不影响其他组件；系统更加灵活，易于维护和升级，并且稳定性和可靠性也更强

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES08 依赖减少与降级
RES11-05 红蓝攻防 - 云架构中心
RES11-05 红蓝攻防 - 云架构中心

RES11-05 红蓝攻防通过红蓝攻防，可以模拟各种复杂的攻击场景，帮助全面评估应用韧性，及时发现并解决潜在风险。风险等级高关键策略蓝军从第三方角度发掘各类脆弱点，并向业务所依赖的各种软硬件注入故障，不断验证业务系统的可靠性；而红军则需要按照预先定义的故障响应和应急流程进行处置

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
RES14-02 自动化变更 - 云架构中心

RES14-02 自动化变更自动化变更是指自动化提供并管理应用程序的环境（计算、存储、网络、中间件服务等）、安装、配置，实现Infrastructure as a Code；以解决手工部署中易于出错、依赖个人能力，手工配置中变更无法跟踪、难以回滚等难题。风险等级高关键策略

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES14 配置防差错
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 CPU /内存/磁盘/带宽使用率过高检测：通过CES监控CPU /内存/磁盘/带宽使用率。恢复：当CPU/内存使用高时，可根据业务情况，手工修改代理规格或增加代理数量以扩展资源。当磁盘使用率高时，可根据业务情况，修改实例存储空间支持更大存储空间。当带宽使用率高时

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DMS分布式消息服务
COST05-03 定期回顾和审核 - 云架构中心

COST05-03 定期回顾和审核风险等级高关键策略为了让云上应用始终最具成本效益，推荐您定期对其进行回顾和审核，以了解是否有机会实施新的优化措施。回顾和审核可以基于成本分配的原则，在应用级别执行，持续审核组织为每个云上应用付出的总体成本。通过综合考虑云资源成本，研发成本

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST05 优化指定策略和目标
RES12-03 定期应急恢复演练 - 云架构中心

RES12-03 定期应急恢复演练定期测试突发事件应急恢复处理，以便在出现问题后能进行高效的恢复处理。风险等级高关键策略每年至少进行一次应急恢复演练；通过演练可提升操作人员的熟练程度。演练期间严格按照应急预案进行恢复，以检验应急预案的准确性。演练结束后需要对恢复过程进行回溯

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理

总条数： 381

上一页
1
...
13
14
15
...
20
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

RES11-01 混沌测试 - 云架构中心

RES12-05 应急恢复回溯 - 云架构中心

可靠性功能 - 云架构中心

COST08-02 云原生架构改造 - 云架构中心

OPS08-03 知识管理 - 云架构中心

通过AOM助力系统运维能力提升，降低运维成本与难度 - 云架构中心

PERF02-01 定义性能目标 - 云架构中心

OPS06-01 建立可观测性体系 - 云架构中心

RES01-02 应用组件多位置部署 - 云架构中心

RES11-03 长稳测试 - 云架构中心

RES12-01 组建应急恢复团队 - 云架构中心

可靠性功能 - 云架构中心

RES01-01 应用组件高可用部署 - 云架构中心

RES07-02 日志统计监控 - 云架构中心

RES08-02 依赖松耦合 - 云架构中心

RES11-05 红蓝攻防 - 云架构中心

RES14-02 自动化变更 - 云架构中心

常见故障模式 - 云架构中心

COST05-03 定期回顾和审核 - 云架构中心

RES12-03 定期应急恢复演练 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线