搜索_华为云

OPS03-05 进行混沌测试和演练 - 云架构中心

定位、快速恢复等确定性恢复能力。验证高可用设计：业务系统在规划设计阶段进行架构高可用设计、监控设计，在上线前进行生产准备度评审 (PRR)、性能压测，确保系统能够持续提供稳定、可靠的服务。混沌工程从应用部署架构、服务容量、监控告警、应用高可用等多维度设计演练场景，先测试、后攻防

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS03 完备的测试验证体系
OPS07-04 支持故障恢复流程 - 云架构中心

基于故障模式库，面向全流程、构建恢复能力、保证平均恢复时长（MTTR）的长效收敛，实现故障的快速恢复。设计建议父主题： OPS07 进行故障分析和管理

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS07 进行故障分析和管理
RES02-03 定期进行备份数据恢复 - 云架构中心

一个测试环境，并使用已有的备份数据进行恢复处理。华为云云服务提供了手工恢复功能，用户可定期执行恢复操作，以进行恢复测试。相关云服务和工具云备份 CBR 云数据库 RDS 分布式缓存服务 DCS 父主题： RES02 备份

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES02 备份
COST03-01 制定成本分摊原则 - 云架构中心

成本分配需匹配业务实质，具体有以下几个原则：按实际使用者进行分配。即谁使用产生的成本分配给谁，而不是谁购买分配给谁。基于实际消耗进行分配。比如客户1月份购买了一个包年资源，365元，按照实际支出这笔成本分配在1月份；如果按照实际消耗，那么就会在整个订购周期进行分配，每天分配1元。这种成本分配机制，更体现了成本责任制。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST03 对成本进行分配
OPS07-01 创建可操作的告警 - 云架构中心

中，根据关键字匹配硬件类告警，以便及时处理。相关云服务和工具应用运维管理 AOM 云运维中心 COC 云监控服务 CES 父主题： OPS07 进行故障分析和管理

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS07 进行故障分析和管理
RES14-04 提供runbook进行标准化变更 - 云架构中心

RES14-04 提供runbook进行标准化变更 runbook是指运行手册，是用来实现变更的详细操作过程。变更前需提供标准化runbook用于变更和回退，变更过程中严格按照runbook执行，在变更失败时根据runbook进行回退。风险等级高关键策略 runbook需

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES14 配置防差错
OPS03-04 对生产环境进行拨测 - 云架构中心

OPS03-04 对生产环境进行拨测风险等级高关键策略拨测是利用软件系统以外，甚至现有账号或云Region外的系统，以系统用户使用场景为视角，模拟用户使用场景的测试。和普通的云拔测可实现对网络质量、页面性能、端口性能、文件传输、音视频体验等场景进行周期性监控，支持多维度分析

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS03 完备的测试验证体系
COST03-02 可视化成本分摊结果 - 云架构中心

如果需要获取明细数据与自身云管平台进行集成，实现定制化的成本和使用分析，您还可以订阅账单明细数据、OBS转储成本明细或调用客户运营能力API。比如将成本和使用明细与企业的业务运营数据结合，生成业务单位成本KPI。父主题： COST03 对成本进行分配

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST03 对成本进行分配
OPS08-02 进行事故复盘和改进 - 云架构中心

OPS08-02 进行事故复盘和改进事故分析的目的是：规范和指导重大事故发生后，优化事故的输入、输出，确保事故回溯工作有效开展，回溯报告中发现的问题有效整改，总结的经验有效推广。风险等级高关键策略故障发生后，通过对现网重大故障处理过程 Review 及根因进行分析和改进总结

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS08 度量运营状态和持续改进
OPS05-01 进行生产准备度评审（Product Readiness Review） - 云架构中心

度，对服务可用性及运维能力提出基线要求。在服务产品开发前端构筑能力，进行相关需求规划、设计和开发工作，并在服务上线前进行生产准入审视。具备以下核心价值： 1）准确评价产品可用性、维护能力并明确相关上线标准；不满足上云标准的服务，原则上不允许上线。 2）持续导入服务可服务性、运维

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS05 运维准备和变更管理
OPS02-01 进行需求管理和迭代开发 - 云架构中心

持续迭代地进行云上软件的更新更有利于运维，因为一则小范围的云上软件更新和部署更不容易引起大范围事故，其次，不停地迭代更新也有效地保证了开发，运维团队成员能够时刻处于练兵状态，不至于对运维的流程，最佳实践比较陌生。要保证云上应用进行迭代更新，那么从需求阶段，就要进行迭代规划和跟踪

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS02 通过CI/CD实现高效的频繁可逆的小规模变更
COST04-01 建立规范，持续提升成本分配比例 - 云架构中心

源标签为空等不合规场景。客户可通过Organization服务，设置标签策略，帮助您在组织账号中对资源添加的标签进行标准化管理。父主题： COST04 持续进行成本治理

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST04 持续进行成本治理
RES04-04 定期进行容灾演练，以检查恢复能否满足容灾目标 - 云架构中心

RES04-04 定期进行容灾演练，以检查恢复能否满足容灾目标通过定期的容灾演练，可以验证灾备系统是否可用，且数据丢失时间以及恢复时间符合数据的RPO与RTO指标要求。风险等级高关键策略每年至少进行一次容灾演练；通过演练可提升操作人员的熟练程度。演练期间需要对恢复过程

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
OPS03-02 使用多个环境进行集成测试，构建和生产环境相同的预生产环境 - 云架构中心

OPS03-02 使用多个环境进行集成测试，构建和生产环境相同的预生产环境风险等级高关键策略开发者测试虽然成本低，但是缺乏对生产环境配置以及不同服务和应用之间实际交互的验证。为此，您的组织可以在云上提供多个环境，典型的环境包含测试环境，预生产环境和生产环境。在生产环境部署

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS03 完备的测试验证体系
SEC06-03 实行代码白盒检视 - 云架构中心

模检视。培训团队成员：提供培训以确保团队成员了解如何进行有效的代码检视。确保团队了解代码检视的目的和重要性，以及如何识别常见问题和潜在的安全漏洞，建议将常犯的TOP问题整理成清单，在开发人员编写代码后自检以及他人检视时进行对照。选择合适的工具：使用代码检视工具来辅助检视

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 应用安全 > SEC06 应用安全性
OPS08-03 知识管理 - 云架构中心
OPS08-03 知识管理 - 云架构中心

涵盖了各个领域和层次的内容。用户可以通过系统进行检索，查找到相关的知识和解决方案。不仅可以解决一些常见的问题，还可以提供高级的技术支持，帮助用户解决复杂的问题。快速定位问题：运维知识库系统配备了强大的搜索功能，用户可以根据关键词进行搜索，系统会自动匹配相关的知识，并提供相应的解

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS08 度量运营状态和持续改进
PERF03-03 使用弹性伸缩 - 云架构中心

节点弹性伸缩：即资源层弹性，主要是集群的容量规划不能满足集群调度容量时，会通过弹出ECS资源的方式进行调度容量的补充。两个维度的弹性组件与能力可以分开使用，也可以结合在一起使用，并且两者之间可以通过调度层面的容量状态进行解耦，详情请参见使用HPA+CA实现工作负载和节点联动弹性伸缩。工作负载弹性组件介绍

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适的计算资源
SEC04-02 控制网络流量的访问 - 云架构中心

对于入站和出站流量，应采用深度防御方法。例如对入站流量进行入侵检测、防范恶意的网络攻击。对出站的流量使用NAT网关配置仅出站的单向连接。流量过滤。使用防火墙、ACL控制内部和外部网络之间的访问流量以及内部网络中敏感区域的输入及输出流量，并对所有网络流量进行检查，阻止与已制定安全标

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC04 网络安全
问题和检查项 - 云架构中心
问题和检查项 - 云架构中心

在迈向卓越运营的过程中，推荐使用如下问题寻找自身可以改进的点，并参考检查项/最佳实践进行改进，以下所有的检查项，也是最佳实践建议，将在下一章节进行详细描述。问题检查项/最佳实践 OPS01 您是否已经建立持续改进的团队文化和标准化运维体系？ 1. 建立持续学习和改进的文化 2. 规划标准化的运维组织 3. 规划标准化的运维流程与运维工具

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
问题和检查项 - 云架构中心
问题和检查项 - 云架构中心

RES02 您如何备份应用程序中的关键数据？识别和备份应用中所有需要备份的关键数据自动数据备份定期进行备份数据恢复 RES03 您如何对应用程序进行跨AZ灾难恢复？集群跨AZ部署跨AZ数据同步对接容灾仲裁，支持自动切换支持容灾管理 RES04 您如何对应用程序进行跨Region或跨云灾难恢复？

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱

总条数： 237

上一页
1
2
3
4
5
...
12
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

OPS03-05 进行混沌测试和演练 - 云架构中心

OPS07-04 支持故障恢复流程 - 云架构中心

RES02-03 定期进行备份数据恢复 - 云架构中心

COST03-01 制定成本分摊原则 - 云架构中心

OPS07-01 创建可操作的告警 - 云架构中心

RES14-04 提供runbook进行标准化变更 - 云架构中心

OPS03-04 对生产环境进行拨测 - 云架构中心

COST03-02 可视化成本分摊结果 - 云架构中心

OPS08-02 进行事故复盘和改进 - 云架构中心

OPS05-01 进行生产准备度评审（Product Readiness Review） - 云架构中心

OPS02-01 进行需求管理和迭代开发 - 云架构中心

COST04-01 建立规范，持续提升成本分配比例 - 云架构中心

RES04-04 定期进行容灾演练，以检查恢复能否满足容灾目标 - 云架构中心

OPS03-02 使用多个环境进行集成测试，构建和生产环境相同的预生产环境 - 云架构中心

SEC06-03 实行代码白盒检视 - 云架构中心

OPS08-03 知识管理 - 云架构中心

PERF03-03 使用弹性伸缩 - 云架构中心

SEC04-02 控制网络流量的访问 - 云架构中心

问题和检查项 - 云架构中心

问题和检查项 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线