搜索_华为云

COST01-03 明确团队责任，建立和维护成本意识文化 - 云架构中心

成本优化的流程中落实成本意识、都需要明确团队责任。一种比较好的实践是使用一组明确定义的 KPI 指标，提供团队级别的报告，实现成本透明度和成本问责制，这些指标可以包含收益/成本比率，单位商品成本，核心资源利用率等等。值得注意的是，成本优化不是一锤子买卖，团队对责任的接受，实施包括指标自身的完善都需要一个过程。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST01 规划成本优化相应的组织机构和流程
内部知识管理类应用典型部署架构（99.9%） - 云架构中心

进行站点运行状态检查，在发生故障时告警；针对ECS、RDS实例负载状态进行监控，在资源过载时需要告警。弹性扩缩容针对内部用户场景，资源足够，无需自动弹性伸缩；针对ECS，通过ELB实现ECS实例的故障检测与负载均衡，并可根据ECS监控情况随时添加和移除ECS实例来扩展应用系统的服务能力；针

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
信息管理类应用典型部署架构（99.95%） - 云架构中心

假定故障中断与变更中断的时长分别如下：故障中断：假定每年故障中断4次，每次应急恢复决策时长为20分钟，恢复处理时长为10分钟，则每年故障中断时长为120分钟。变更中断：假定应用支持离线更新与在线补丁，每年离线更新4次，每次更新时长30分钟，则每年更新时长为120分钟；在线补丁不影响业务。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
金融类核心应用典型部署架构（99.999%） - 云架构中心

假定故障中断与变更中断的时长分别如下：故障中断：由于要求的故障中断时间很短，要求尽可能自动恢复，没有手动触发的恢复，假定每年故障中断4次，每次自动恢复时长为1分钟，则每年故障中断时长为4分钟。变更中断：假定应用支持金丝雀部署或蓝绿部署，并自动完成，软件更新不中断业务。按照以上

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
SEC02-03 网络访问权限最小化 - 云架构中心

根据业务实际情况优化每个网络区域的ACL，并保证访问控制规则数量最小化。避免暴露多余的公网IP，同时不应对外开放或未最小化开放高危端口、远程管理端口。安全组仅开放业务所需的网段及端口，禁止设置成对所有IP(0.0.0.0/0)都可访问。相关云服务和工具虚拟私有云 VPC NAT网关

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC04 网络安全
RES07-05 端到端跟踪请求消息 - 云架构中心

RES07-05 端到端跟踪请求消息端到端跟踪请求消息的处理流程，便于分析和调试问题，并提高处理性能。风险等级低关键策略消息跟踪需要包含消息处理流程中所有组件，以便跟踪结果完整，从而进行准确分析和定位。相关云服务和工具应用性能管理 APM：支持调用链追踪，能够针对应

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
OPS04-03 基础设施即代码 - 云架构中心

回收闲置资源：由于配置管理工具及其限制等原因，有时 IaC 工具无法自动删除资源。例如，假设需要从虚拟机迁移到 PaaS 服务，而 IaC 工具没有删除闲置资源的逻辑。如果忘记手动删除这些资源，这些资源可能会成为孤立资源。为了处理这些场景，需要标准化扫描闲置资源并明确删除策略。相关云服务和工具资源编排服务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS04 自动化构建和部署流程
RES13-03 过载检测与流量控制 - 云架构中心

RES13-03 过载检测与流量控制当应用系统发生过载时，可能会导致系统疲于处理请求而无法有效提供服务，因此需要进行过载检测并进行流量控制。风险等级高关键策略过载控制(也称流控)指系统处于过载时，通过限流、降级、熔断、弹性伸缩等手段，使系统保证部分或者全部额定容量业务成

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
RES10-04 健康检查与自动隔离 - 云架构中心

关键策略对系统内组件需要定期进行健康检查，以判断其状态是否正常。对于异常组件，需要能支持自动隔离，避免对整体业务造成影响。相关云服务和工具弹性负载均衡器 ELB：支持健康检查，会定期向后端服务器发送请求以测试其运行状态，并根据健康检查来判断后端服务器是否可用，当判断为异常后就不会将流量分发给该异常后端服务器。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES10 故障隔离
RES12-01 组建应急恢复团队 - 云架构中心

组件或关键依赖项运维责任人：负责问题定位和应急恢复处理。制定应急恢复管理方案：所有应急恢复团队人员都需要进行应急恢复培训，熟悉应急恢复处理流程和恢复方法。父主题： RES12 应急恢复处理

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
RES01-01 应用组件高可用部署 - 云架构中心

用，若必须用时需要从应用层来实现高可用，以便在所依赖的硬件故障时业务能快速恢复。虚拟机HA：当ECS不依赖于特殊资源时，可以支持虚拟机故障自动恢复功能，在其所在物理服务器故障的情况下，可以自动在其他物理服务器上重启；对于部署在这种ECS中的工作负载，需要支持虚拟机重启后业务自动

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES01 冗余
PERF03-02 选择合适规格的虚拟机和容器节点 - 云架构中心

、大规模文件存储、编译构建等场景）可能会比较消耗存储的带宽。根据业务的特征选择合适的虚拟机类型和规格。具体的虚拟机类型规格请参考官方文档。相关云服务和工具弹性云服务器 ECS 裸金属服务器 BMS 父主题：选择合适的计算资源

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适的计算资源
RTO与RPO - 云架构中心
RTO与RPO - 云架构中心

数小时至1天 5 实时数据传输及完整设备支持：数据丢失趋于0，备用数据系统就绪，远程数据复制，备用网络就绪数分钟至2天 0至30分钟 6 数据零丢失和远程集群支持：数据零丢失，自动系统故障切换，远程磁盘镜像，备用网络active 数分钟 0 父主题：可用性目标定义

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念 > 可用性目标定义
SEC06-03 实行代码白盒检视 - 云架构中心

问题和改进空间。风险等级中关键策略制定检视计划：确定检视的频率和时间安排，以确保代码检视是持续的活动。确定检视范围，例如可以是每次提交、每个功能完成后，或者定期的大规模检视。培训团队成员：提供培训以确保团队成员了解如何进行有效的代码检视。确保团队了解代码检视的目

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 应用安全 > SEC06 应用安全性
RES04-01 定义应用系统的容灾目标RPO与RTO - 云架构中心

风险等级高关键策略不同的业务系统重要性不一样，针对应用系统内的各种业务，需要明确其重要性及对应的RPO/RTO指标要求。比如对于核心业务，通常需要保障业务的连续性，允许业务中断的时间会比较少，从而需要保障故障场景下的业务快速恢复，可采用双活/多活容灾；对于重要业务，允许一定的

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
可用性需求 - 云架构中心
可用性需求 - 云架构中心

根据“常见IT系统SLO示意”中的表格可以得知，不同的IT系统，SLO目标是存在差异的，不是所有的应用系统都需要达到最高可用性要求。当系统可用性目标要求升高时，所需的成本也通常会增加，因此在可用性目标制定时，需要对韧性与成本进行权衡，确定真正的可用性需求。在系统的可用性目标明确后，可参考以下韧性

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

可靠性功能数据持久性 OBS通过存储介质的慢盘/坏道检测、AZ内设备和数据冗余、AZ之间数据容灾、跨区域复制等技术方案，提供针对介质、服务器、机柜、数据中心和区域的多级可靠性保障。其数据持久性高达99.9999999999%（12个9），可用性高达99.995%，远高于传统架构。详见“OBS的持久性和可用性如何

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > OBS对象存储服务
RES06-01 故障模式分析 - 云架构中心

的故障管理，应用系统可减少对机房、电力、环境、计算服务器、存储设备、网络交换机等基础设施的故障模式的检测和恢复处理，但仍需考虑这些基础设施故障对应用系统的影响及对应的恢复措施，如机房发生灾难(AZ或Region级灾难)、计算服务器故障/重启、使用本地硬盘时硬盘故障/亚健康、网络通

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES06 故障检测
RES09 故障重试 - 云架构中心
RES09 故障重试 - 云架构中心

原因故障时，ECS重启或在其他物理服务器中自动恢复，恢复过程中与ECS的通信会中断，需要重试。实例由于过载导致无法及时响应，需要重试。 RES09-01 API及命令调用需要设计为可重试 RES09-02 客户端需要根据综合评估是否要重试 RES09-03 重试需要避免造成流量压力

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复
SEC05-06 使用托管云服务 - 云架构中心

为云的数据库服务而不是自建关系型数据库的实例。使用Serverless架构的云服务，将计算资源的安全交给华为云处理，减免了用户自行运维服务器带来的工作量和人为错误，减少了安全漏洞的风险。这样，用户能够将更多精力集中在业务逻辑和应用的安全性上。相关云服务和工具云数据库 RDS

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC05 运行环境安全

总条数： 197

上一页
1
2
3
4
5
...
10
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

COST01-03 明确团队责任，建立和维护成本意识文化 - 云架构中心

内部知识管理类应用典型部署架构（99.9%） - 云架构中心

信息管理类应用典型部署架构（99.95%） - 云架构中心

金融类核心应用典型部署架构（99.999%） - 云架构中心

SEC02-03 网络访问权限最小化 - 云架构中心

RES07-05 端到端跟踪请求消息 - 云架构中心

OPS04-03 基础设施即代码 - 云架构中心

RES13-03 过载检测与流量控制 - 云架构中心

RES10-04 健康检查与自动隔离 - 云架构中心

RES12-01 组建应急恢复团队 - 云架构中心

RES01-01 应用组件高可用部署 - 云架构中心

PERF03-02 选择合适规格的虚拟机和容器节点 - 云架构中心

RTO与RPO - 云架构中心

SEC06-03 实行代码白盒检视 - 云架构中心

RES04-01 定义应用系统的容灾目标RPO与RTO - 云架构中心

可用性需求 - 云架构中心

可靠性功能 - 云架构中心

RES06-01 故障模式分析 - 云架构中心

RES09 故障重试 - 云架构中心

SEC05-06 使用托管云服务 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线