搜索_华为云

RES06-03 支持亚健康检测 - 云架构中心

RES06-03 支持亚健康检测系统内组件有可能完全故障，也有可能处于亚健康状态；亚健康是指系统整体业务未超标，但系统中局部实例业务超标。亚健康更多是个相对概念，相对历史表现的统计，或相对系统整体。因此针对亚健康的检测和判断有所不同。当处于亚健康状态时，系统也需要及时进行隔离或恢复处理，避免对业务造成影响。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES06 故障检测
PERF03-04 选择合适类型的网络云服务 - 云架构中心

NAT gateway 通过地址转换的方式，使多个云主机可以共享私网IP访问用户本地数据中心或其他VPC，并支持云主机面向私网提供服务。应用组网（用户<->云） ELB 针对HTTP/HTTPS的流量做负载分发，扩展应用系统对外的服务能力，提高应用程序的容错能力。 VPC Endpoint

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适网络服务资源
可用性需求 - 云架构中心
可用性需求 - 云架构中心

根据“常见IT系统SLO示意”中的表格可以得知，不同的IT系统，SLO目标是存在差异的，不是所有的应用系统都需要达到最高可用性要求。当系统可用性目标要求升高时，所需的成本也通常会增加，因此在可用性目标制定时，需要对韧性与成本进行权衡，确定真正的可用性需求。在系统的可用性目标明

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念
OPS04-02 采用持续部署模型 - 云架构中心

现问题，减少对最终用户的影响。金丝雀部署是持续部署的常见模型，通过一小群内部或外部用户首先部署新功能，当新版本没有问题后，陆续部署到更大的组，直到所有用户群体都运行新版本。另一种常见的部署模型是蓝绿部署，通过部署了两组相同的工作负载实例，分别处理完整的生产负载。第一个（蓝色）

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS04 自动化构建和部署流程
OPS03-03 进行性能压测 - 云架构中心

性能压测主要通过自动化的测试工具模拟多种正常、峰值以及异常负载条件来对系统的各项性能指标进行测试。通常把性能测试、负载测试、压力测试等统称为性能压测。广义而言，是为保证系统运行后的性能可以满足用户需求，而开展的一系列测试组织工作。在应用系统上线发布之前，通过性能压测，测试应用系统能承受的最大并发、响应速度、以及稳

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS03 完备的测试验证体系
AS弹性伸缩 - 云架构中心
AS弹性伸缩 - 云架构中心

则来自动增加/缩减业务资源。当业务需求增长时，AS自动增加弹性云服务器（ECS）实例或带宽资源，以保证业务能力；当业务需求下降时，AS自动缩减弹性云服务器（ECS）实例或带宽资源，以节约成本。AS支持自动调整弹性云服务器和带宽资源。可靠性功能常见故障模式父主题：云服务可靠性介绍

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

备份，在数据被删除时使用备份数据快速恢复。 BMS实例物理服务器或本地盘故障检测：应用层检测物理服务器和本地盘运行状态恢复：应用层采用RAID实现BMS内硬盘高可用，并实现跨BMS的数据复制与高可用，以便在物理服务器或本地盘故障时业务可快速恢复。建议非必须使用本地盘场景，尽可

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > BMS裸金属服务
OPS06-02 定义可观测对象 - 云架构中心

YSQL_EXPORTER 主机监控主机监控提供了包括基础监控和操作系统监控两种不同监控粒度层次的监控。基础监控为 ECS自动上报的监控指标，操作系统监控通过在ECS中安装Agent插件，为用户提供服务器的系统级、主动式、细颗粒度监控服务。主要关注：CPU_UTIL、DISK_

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
RES10-01 应用控制平面与数据平面隔离 - 云架构中心

而控制平面不直接处理业务，因此其故障时不应该影响业务系统。风险等级高关键策略应用控制平面与数据平面隔离，避免控制系统故障影响业务。数据平面所在业务系统的故障恢复可不依赖控制平面，避免由于控制平面故障而导致业务系统无法恢复。父主题： RES10 故障隔离

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES10 故障隔离
问题和检查项 - 云架构中心
问题和检查项 - 云架构中心

也是最佳实践建议，将在下一章节进行详细描述。问题检查项/最佳实践 RES01 您如何使用冗余技术确保应用系统的高可用？应用组件高可用部署应用组件多位置部署云服务器反亲和 RES02 您如何备份应用程序中的关键数据？识别和备份应用中所有需要备份的关键数据自动数据备份定期进行备份数据恢复

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
RES10-03 采用Grid架构 - 云架构中心

元没有影响，从而减少爆炸半径。应用系统典型Grid架构部署如下：实施步骤：确定分区键。选择分区键应考虑：选择分区键必须考虑匹配服务的“粒度”或者考虑以最小的方式跨分区互动。对于多用户系统，可使用用户ID作为分区键；而对于资源为对象的系统，则可以使用资源ID作为分区键。所

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES10 故障隔离
SEC05-02 实施漏洞管理 - 云架构中心

漏洞管理有助于及时发现并修复系统中存在的安全漏洞，防范潜在的安全威胁和攻击。安全漏洞可能使他人非法获得系统访问特权，应通过可信渠道获取最新的安全情报。风险等级高关键策略安全漏洞可通过及时安装安全补丁的方式修复漏洞，以防恶意个人或软件非法利用从而破坏业务系统和数据。通过及时了解最

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC05 运行环境安全
跨云容灾方案 - 云架构中心
跨云容灾方案 - 云架构中心

演练，及时发现问题。根据以上方案，典型部署架构如下：该架构的主要特点包括：应用系统采用无状态应用+有状态数据库/虚拟机的分层部署架构。应用系统在IDC/其他云与华为云中各部署一套完整系统；华为云采用跨AZ部署，可以实现云内应用层跨数据中心双活；云间数据支持将它云数据实时同

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 跨云场景典型部署架构（99.99%）
OPS03-04 对生产环境进行拨测 - 云架构中心

OPS03-04 对生产环境进行拨测风险等级高关键策略拨测是利用软件系统以外，甚至现有账号或云Region外的系统，以系统用户使用场景为视角，模拟用户使用场景的测试。和普通的云拔测可实现对网络质量、页面性能、端口性能、文件传输、音视频体验等场景进行周期性监控，支持多维度分

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS03 完备的测试验证体系
OPS03-05 进行混沌测试和演练 - 云架构中心

Engineering）是通过故障注入，验证故障快速恢复能力及系统可靠性的实践活动。风险等级高关键策略通过混沌工程的方法模拟可能出现的故障，进而综合验证系统在不同故障场景下的容错能力、监控能力、应急响应能力、定界定位、快速恢复等确定性恢复能力。验证高可用设计：业务系统在规划设计阶段进行架构高可用设计、监控设计，在上线前进行生产准备度评审

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS03 完备的测试验证体系
RES07-03 监控到异常后发送消息通知 - 云架构中心

RES07-03 监控到异常后发送消息通知当对应用系统监控发现应用异常后，需要向相应的人员和系统发送实时通知消息和告警，以便及时处理。风险等级中关键策略采用实时快捷的消息通知方式，以便相关人员能及时得到消息。消息发送人员需要涵盖运维人员，以便及时恢复。运维人员需要有备份，避免单点风险。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
多活高可用(MAS) - 云架构中心
多活高可用(MAS) - 云架构中心

主动注入故障识别并修复系统未知隐患的工程实践。MAS-CAST混沌工程服务提供丰富的故障模式库，通过混沌实验编排攻击目标、攻击策略进行故障注入，支持添加背景流量和资源监控，同时在故障注入能力的基础上，通过体系化的流程和规范来创建故障演练，从而验证和提升系统可靠性和技术团队应急响应能力。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
OPS06-04 规范化应用日志 - 云架构中心

OPS06-04 规范化应用日志日志是随时间推移发生的不可变、记录时间戳的离散事件。系统需要记录关键事件和故障，以帮助诊断问题和解决故障。风险等级高关键策略对于一个系统来说，日志是非常重要的。它可以记录在系统中发生的一切，包括成功的操作、错误的操作、警告信息等等。因此，日志记录是可

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
SEC09-01 实施标准化管理日志 - 云架构中心

施标准化管理，以监测系统和用户活动，实现日志的统一管理，并确保透明可追溯。风险等级高关键策略跟踪并监测对网络资源和关键数据的所有访问。通过系统的活动记录机制和用户活动跟踪功能可有效降低恶意活动对于数据的威胁程度。常见的安全日志如主机安全日志、操作系统日志、堡垒机日志、IA

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC09 安全感知及分析
RES07-04 监控数据存储和分析 - 云架构中心

监控数据包括统计和日志信息，均需要存储并进行生命周期管理，以满足数据监控的保留要求；并定期对其进行分析，以了解系统运行状态和趋势。风险等级中关键策略监控数据存储时长需要满足保留要求。监控数据需要定期分析，以便发现或预测系统故障，减少业务中断。相关云服务和工具 LTS云日志服务：支持日志分析与数据转储

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警

总条数： 226

上一页
1
2
3
4
5
...
12
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

RES06-03 支持亚健康检测 - 云架构中心

PERF03-04 选择合适类型的网络云服务 - 云架构中心

可用性需求 - 云架构中心

OPS04-02 采用持续部署模型 - 云架构中心

OPS03-03 进行性能压测 - 云架构中心

AS弹性伸缩 - 云架构中心

常见故障模式 - 云架构中心

OPS06-02 定义可观测对象 - 云架构中心

RES10-01 应用控制平面与数据平面隔离 - 云架构中心

问题和检查项 - 云架构中心

RES10-03 采用Grid架构 - 云架构中心

SEC05-02 实施漏洞管理 - 云架构中心

跨云容灾方案 - 云架构中心

OPS03-04 对生产环境进行拨测 - 云架构中心

OPS03-05 进行混沌测试和演练 - 云架构中心

RES07-03 监控到异常后发送消息通知 - 云架构中心

多活高可用(MAS) - 云架构中心

OPS06-04 规范化应用日志 - 云架构中心

SEC09-01 实施标准化管理日志 - 云架构中心

RES07-04 监控数据存储和分析 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线