搜索_华为云

OPS01-02 规划标准化的运维组织 - 云架构中心

无论如何设立组织，应该确保具有一个整体的流程，在流程中的每个团队和成员都有自己明确的责任。同时可以使用明确的方式（如收集运营/运维数据）分析团队工作对业务成果的影响，从而可以在实际工作中确定不同任务的优先级，并适时改进。父主题： OPS01 建立持续改进的团队文化和标准化的运维体系

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS01 建立持续改进的团队文化和标准化的运维体系
OPS01-03 规划标准化的运维流程和运维工具 - 云架构中心

OPS01-03 规划标准化的运维流程和运维工具风险等级高关键策略流程和工具是经验的承载，通过标准化的流程，可以大幅降低在运维过程中因为个人的因素受到的影响和无序化。通过标准化的、统一的运维工具，向运维人员提供集中、统一维护界面及清晰易上手的操作手册，方便运维人员的集中维护，提高运维效率。常见的运维流程有：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS01 建立持续改进的团队文化和标准化的运维体系
RES06-03 支持亚健康检测 - 云架构中心

RES06-03 支持亚健康检测系统内组件有可能完全故障，也有可能处于亚健康状态；亚健康是指系统整体业务未超标，但系统中局部实例业务超标。亚健康更多是个相对概念，相对历史表现的统计，或相对系统整体。因此针对亚健康的检测和判断有所不同。当处于亚健康状态时，系统也需要及时进行隔离或恢复处理，避免对业务造成影响。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES06 故障检测
PERF03-05 选择合适类型的存储云服务 - 云架构中心

富并且可弹性扩展的块存储服务，可满足不同场景的业务需求。云硬盘就类似PC中的硬盘。存储数据的逻辑存放的是文件，会以文件和文件夹的层次结构来整理和呈现数据。存放的是对象，可以直接存放文件，文件会自动产生对应的系统元数据，用户也可以自定义文件的元数据。存放的是二进制数据，无法

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适的存储云服务
OPS06-06 实施分布式跟踪 - 云架构中心

Trace是一系列因果相关的分布式事件的表示，这些事件编码了流经分布式系统的端到端请求流。风险等级高关键策略当系统出现问题时，需要能够追踪系统中每个组件的行为和交互情况。通过在系统中实现分布式跟踪，可以快速定位问题并进行有效的故障排除。设计建议链路跟踪可以通过在系统中添加跟踪标识

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
OPS02 通过CI/CD实现高效的频繁可逆的小规模变更 - 云架构中心

OPS02 通过CI/CD实现高效的频繁可逆的小规模变更 OPS02-01 进行需求管理和迭代开发 OPS02-02 关联源代码版本和部署的应用版本，使用代码质量最佳实践父主题：卓越运营支柱

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
OPS03-01 推行开发者测试 - 云架构中心

此外，云上的软件是不断演进和重构的，很多时候我们不敢修改已有系统代码的原因，就是不知道它的影响范围，担心产生某种程度上的蝴蝶效应，影响了其它模块而造成线上系统的问题，有了开发者测试之后，只要在改完代码后运行一下测试就知道改动对整个系统的影响了，从而可以让我们放心的重构和演进代码。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS03 完备的测试验证体系
设计原则 - 云架构中心
设计原则 - 云架构中心

国际标准化组织（ISO）对计算机系统安全的定义为：确保信息资产（包括硬件、软件、网络、数据等）受到保护，以确保其机密性、完整性和可用性。计算机系统安全的目标是保护信息系统免受未经授权的访问、使用、披露、破坏、修改、中断或不可用的威胁，同时确保信息系统能够持续地提供服务。系统安全的基本要素包括机密

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱
RES13-03 过载检测与流量控制 - 云架构中心

过载检测与流量控制当应用系统发生过载时，可能会导致系统疲于处理请求而无法有效提供服务，因此需要进行过载检测并进行流量控制。风险等级高关键策略过载控制(也称流控)指系统处于过载时，通过限流、降级、熔断、弹性伸缩等手段，使系统保证部分或者全部额定容量业务成功处理的控制过程；典型过载控制方法定义如下：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
OPS06-01 建立可观测性体系 - 云架构中心

可观测性（observability）最初是系统理论中的一个概念，指系统的状态能否被外部观察到和重现。随着云原生、微服务架构的发展，IT系统对可观测性的需求日益增强。业界对可观测性的定义：通常是指基于对复杂系统外部输出的了解，能够了解其内部状态或状况的程度。系统越可观测，定位问题根本原因的过程就越快速越准确，而无需进行额外的测试或编码。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
RES07-01 定义关键指标与阈值并监控 - 云架构中心

资源监控通常用于识别资源瓶颈分析系统性能问题。对应用系统资源进行监控时，需要先定义资源的关键指标以及对应的阈值，以便快速有效的发现业务表现和系统状态，以便在异常状态下尽早干预恢复，或定位改进系统缺陷。关键指标需要与系统内工作负载的关键性能指标相关，并能确定为系统性能下降的早期警告信号，如系统处理的API

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
OPS01 建立持续改进的团队文化和标准化的运维体系 - 云架构中心

OPS01 建立持续改进的团队文化和标准化的运维体系 OPS01-01 建立持续学习和改进的文化 OPS01-02 规划标准化的运维组织 OPS01-03 规划标准化的运维流程和运维工具父主题：卓越运营支柱

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
设计原则 - 云架构中心
设计原则 - 云架构中心

单点故障会导致整个系统崩溃、主要功能受到影响、任务延误的系统轻度损坏或存在较大的故障隐患，因此系统的高可用设计非常关键。高可用设计的主要手段是冗余，甚至是多级冗余的组合，包括异地容灾方式保证灾难情况下无单点：冗余机制：只要条件允许，需要考虑关键组件的冗余，甚至是多级冗余的组合（例如：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
跨云容灾方案 - 云架构中心
跨云容灾方案 - 云架构中心

跨云容灾方案当重要应用系统已经在IDC或其他云上部署，并需要容灾到华为云，以提供高可用的容灾方案。假定应用系统在IDC或其他云上可以达到99.9%的可用性，则在容灾到华为云后，能提供99.99%的可用性。跨云应用典型架构为前端无状态应用层+后端数据库，其中前端无状态应用可采用

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 跨云场景典型部署架构（99.99%）
什么是应用韧性 - 云架构中心
什么是应用韧性 - 云架构中心

接中断，需要应用系统具备链接中断重试的功能。由于外部流量突发导致业务过载，需要应用系统具备流量控制的能力。部分强依赖于硬件的负载，如依赖本地硬盘、GPU等，由于硬件故障导致服务中断，需要应用系统自身构建高可用的能力。不同的应用系统，可用性要求可能不同，采用的韧性恢复方案会有差异。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念
RES10-01 应用控制平面与数据平面隔离 - 云架构中心

应用控制平面与数据平面隔离通常应用的数据平面处理业务，比较重要，可用性要求比较高，而控制平面不直接处理业务，因此其故障时不应该影响业务系统。风险等级高关键策略应用控制平面与数据平面隔离，避免控制系统故障影响业务。数据平面所在业务系统的故障恢复可不依赖控制平面，避免由于控制平面故障而导致业务系统无法恢复。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES10 故障隔离
RES06-01 故障模式分析 - 云架构中心

故障模式分析是在系统分析和设计过程，通过对各组成单元潜在的各种故障模式及其对产品功能的影响进行分析，并把每一种潜在故障模式按它的严酷度予以分类，找出单点故障和产品的薄弱环节，提出可以采取的预防改进措施，以提高产品可靠性的一种设计方法。当应用系统部署在华为云中时，华为云提供了基础设施

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES06 故障检测
COST01-04 指定云资源管理策略和相应的权限管理机制 - 云架构中心

用不同的账号和环境。然而即使账号/环境是分散的，云资源管理策略和权限管理机制应该是集中的。企业的中心团队，如上文所提的云业务办公室、云卓越中心或 FinOps 团队需要为各个账号环境实施与策略一致的组和角色，控制每个组中谁可以创建、修改或停用实例和资源。同时依据企业的业务环境

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST01 规划成本优化相应的组织机构和流程
COST07-03 考虑不同的云资源技术选型 - 云架构中心

COST07-03 考虑不同的云资源技术选型风险等级中关键策略定期咨询专家或华为合作伙伴，以便确定哪些服务和功能的成本更低。查看华为博客和其他信息源。如在非计算密集型场景，使用华为云的云耀系列服务器取代普通ECS服务器父主题： COST07 管理和优化资源

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST07 管理和优化资源
RES13-01 采用自动弹性扩缩容 - 云架构中心

不变，通过增加节点的数量来改变系统的处理能力，称之为横向伸缩。系统设计时一般建议采用横向伸缩。采用横向伸缩时，要求业务与数据解耦，即将系统的业务处理逻辑与数据分离、数据（状态）外置，以实现业务节点（含资源）无状态，按需快速增加或减少，从而实现系统业务处理能力的伸缩。当节点故障

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护

总条数： 255

上一页
1
2
3
4
5
...
13
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

OPS01-02 规划标准化的运维组织 - 云架构中心

OPS01-03 规划标准化的运维流程和运维工具 - 云架构中心

RES06-03 支持亚健康检测 - 云架构中心

PERF03-05 选择合适类型的存储云服务 - 云架构中心

OPS06-06 实施分布式跟踪 - 云架构中心

OPS02 通过CI/CD实现高效的频繁可逆的小规模变更 - 云架构中心

OPS03-01 推行开发者测试 - 云架构中心

设计原则 - 云架构中心

RES13-03 过载检测与流量控制 - 云架构中心

OPS06-01 建立可观测性体系 - 云架构中心

RES07-01 定义关键指标与阈值并监控 - 云架构中心

OPS01 建立持续改进的团队文化和标准化的运维体系 - 云架构中心

设计原则 - 云架构中心

跨云容灾方案 - 云架构中心

什么是应用韧性 - 云架构中心

RES10-01 应用控制平面与数据平面隔离 - 云架构中心

RES06-01 故障模式分析 - 云架构中心

COST01-04 指定云资源管理策略和相应的权限管理机制 - 云架构中心

COST07-03 考虑不同的云资源技术选型 - 云架构中心

RES13-01 采用自动弹性扩缩容 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线