搜索_华为云

常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

/内存/带宽/连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。应用层进行过载保护，保障优先业务的运行，如将部分性能要求不高的业务切回到原始数据源。连接后端DCS失败检测：连接失败。恢复：应用层进行重试，以应对暂时性故障，如DCS实例正在进行主备切换时；应用故障重试处理可参考“故障重试”。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

/内存/磁盘容量/磁盘IOPS/数据库连接数使用率过高检测：通过CES监控CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。开启自动扩缩容，以便在过载时自动扩容规格和/或只读节点。应用层进行过载保护，保障优先业务的运行。连接后端GaussDB(for

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > GaussDB(for MySQL)云数据库
人工智能性能优化 - 云架构中心

属block有其他stream信息，此时会给对应stream下发一个event_record task然后返回。在之后本stream在每一次新申请内存时，均做一下event_query操作，如果发现event已经被record则其他stream上的task已经执行完成，此时可以放心地回收这个block。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
卓越架构技术框架简介 - 云架构中心

一系列设计原则与最佳实践，用以帮助企业利用华为云平台基础设施达到高可用、面向各种故障场景进行韧性设计，并具备一定的灾备能力；同时通过规范化变更、部署及应急恢复等处理流程，减少业务中断时长，提升可用性。安全性支柱：旨在确保业务的安全、可信、合规，通过一系列华为云架构的最佳实践保

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践
PERF06-01 分层看护 - 云架构中心

PERF06-01 分层看护风险等级高关键策略基于业务的部署架构，一般可以从最底层的硬件基础设施到最上层的应用分成5层资源，云上服务可以只需要关注虚拟网络、实例、应用三层。结合每一层资源的特征指标进行分层建模，分别设置不同梯度的性能看护指标。通常按照指标劣化程度可以设计成

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF06 性能看护 > 性能看护
RES09-01 API及命令调用需要设计为可重试 - 云架构中心

RES09-01 API及命令调用需要设计为可重试在进行重试处理时，API及命令调用会重复发送，服务方会多次重复执行，需要保证重复执行多次的结果不变。风险等级高关键策略应用系统在设计时，应使操作具有幂等性，也就是允许一个操作连续执行两次或多次时，应该与单次调用产生的结果

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES09 故障重试
云运维中心(COC) - 云架构中心
云运维中心(COC) - 云架构中心

风险评估：基于场景规则、流程规则、业务规则对变更进行管控，提前识别和拦截变更风险；通过变更日历实现变更冲突检测，降低服务间变更依赖导致的变更风险。实施保障：按预定方案执行变更，变更步骤标准化、可观测，变更异常及时介入处理，实现变更实施全过程可控、可视、可管。确定性故障管理

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
SEC06-01 安全合规使用开源软件 - 云架构中心

降低开源漏洞的影响。开源软件的安全漏洞传播快，影响大。一旦出现安全漏洞，快速排查受影响的产品并进行修复是降低影响的关键。可追溯。对开源软件的变更过程可控、有记录可查，建立产品版本与第三方软件及漏洞的关系。父主题： SEC06 应用安全性

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 应用安全 > SEC06 应用安全性
SEC04-02 控制网络流量的访问 - 云架构中心

对所有网络流量进行检查，阻止与已制定安全标准不相符的流量，以避免系统组件受到来自不可信网络的非授权访问。使用应用负载均衡时，七层负载均衡更换为安全的证书。启用VPC流量日志。VPC流日志功能可以记录虚拟私有云中的流量信息，帮助用户优化安全组和防火墙控制规则、监控网络流量、进行

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC04 网络安全
Serverless性能优化 - 云架构中心

onGraph函数的性能很大程度上取决于需要FunctionGraph函数执行何种逻辑。策略：正确的使用连接池，保持连接存活并重用在上一次调用中建立的连接（HTTP，数据库、redis等）。通过接口调用FunctionGraph函数时，建议客户端维护http连接池，减少http连接初始化时间。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
RES03-01 集群跨AZ部署 - 云架构中心

或ELB跨AZ负载均衡能力，实现跨AZ高可用，在一个可用区故障时能自动快速切换。对于有状态ECS实例，或BMS实例，建议从应用层实现跨AZ容灾，支持跨AZ自动切换或通过容灾管理工具实现自动化容灾切换，减少灾难发生时的人工操作。对于已部署的应用系统改造为跨AZ实例的实施步骤：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾
RES03 跨AZ容灾 - 云架构中心
RES03 跨AZ容灾 - 云架构中心

或应用自身支持的跨AZ数据复制与切换能力，在多个AZ之间复制数据、负载均衡和跨AZ故障切换，从而使应用系统具备应对可用区故障的能力。 RES03-01 集群跨AZ部署 RES03-02 跨AZ数据同步 RES03-03 对接容灾仲裁，支持自动切换 RES03-04 支持容灾管理父主题：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计
基础概念 - 云架构中心
基础概念 - 云架构中心

Identify）平均发现时长、MTTK（Mean Time to Know）平均诊断时长、MTTF（Mean Time to Fix）平均修复时长变更风险控制在变更作业过程中，建立事前检查、事中拦截和事后验证的能力，防止异常行为。安全生产安全生产目的是为了持续保障现网“安全、稳定、高质量”

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
OPS01-02 规划标准化的运维组织 - 云架构中心

OPS01-02 规划标准化的运维组织风险等级高关键策略承载卓越运营，应该建立适应您实际的运维组织。运维组织的团队之间具有明确的流程，规定了团队之间的协作方式，例如规定不同团队的响应时间、服务级别目标（SLO) 或服务等级协议(SLA），同时应该记录团队间沟通信息，确保有足够的数据用于后续的改进。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS01 建立持续改进的团队文化和标准化的运维体系
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

理规格或增加代理数量以扩展资源。当磁盘使用率高时，可根据业务情况，修改实例存储空间支持更大存储空间。当带宽使用率高时，可根据业务情况，变更规格以支持更大带宽。应用层进行过载保护，保障优先业务的运行。生产消息失败检测：生产消息失败恢复：应用层进行重试，以应对暂时性故障；应用故障重试处理可参考“故障重试”。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DMS分布式消息服务
Spark性能优化 - 云架构中心
Spark性能优化 - 云架构中心

内存中，提供了比MapReduce高10到100倍的计算能力。Spark可以使用HDFS作为底层存储，使用户能够快速地从MapReduce切换到Spark计算平台上去。Spark提供一站式数据分析能力，包括小批量流式处理、离线批处理、SQL查询、数据挖掘等，用户可以在同一个应用中无缝结合使用这些能力。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
RES09-03 重试需要避免造成流量压力 - 云架构中心

RES09-03 重试需要避免造成流量压力对于链路闪断等原因导致的临时性故障，客户端进行一定的重试，可取得较好的效果；对于流量过载等原因导致的故障，重试可能会导致情况进一步恶化，因此需要避免这种影响。风险等级高关键策略客户端进行重试处理时，建议：增加指数回退和抖动方法

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES09 故障重试
问题和检查项 - 云架构中心
问题和检查项 - 云架构中心

有效落地持续集成 2. 采用持续部署模型 3. 基础设施即代码 4. 自动化工程运维任务 OPS05 是否有运维准备和变更管理体系？ 1. 进行生产准备度评审 2. 进行变更风控 3. 定义变更流程 OPS06 是否建立了完备的可观测体系？ 1.建立可观测体系 2.定义可观测对象 3.制定和实施可观测性指标

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
卓越运营支柱 - 云架构中心
卓越运营支柱 - 云架构中心

建立持续改进的团队文化和标准化的运维体系 OPS02 通过CI/CD实现高效的频繁可逆的小规模变更 OPS03 完备的测试验证体系 OPS04 自动化构建和部署流程 OPS05 运维准备和变更管理 OPS06 可观测性体系 OPS07 进行故障分析和管理 OPS08 度量运营状态和持续改进

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践
SEC10-04 安全事件演练 - 云架构中心

SEC10-04 安全事件演练安全事件演练是一种模拟性的活动，旨在让组织成员在一个模拟的安全事件场景下进行实际操作和应对，以测试和提高其应对安全事件的能力。通过安全事件演练，组织可以评估其安全事件响应计划的有效性，发现潜在的问题并进行改进，提高团队的准备性和反应能力。风险等级

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC10 安全事件响应

总条数： 131

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

人工智能性能优化 - 云架构中心

卓越架构技术框架简介 - 云架构中心

PERF06-01 分层看护 - 云架构中心

RES09-01 API及命令调用需要设计为可重试 - 云架构中心

云运维中心(COC) - 云架构中心

SEC06-01 安全合规使用开源软件 - 云架构中心

SEC04-02 控制网络流量的访问 - 云架构中心

Serverless性能优化 - 云架构中心

RES03-01 集群跨AZ部署 - 云架构中心

RES03 跨AZ容灾 - 云架构中心

基础概念 - 云架构中心

OPS01-02 规划标准化的运维组织 - 云架构中心

常见故障模式 - 云架构中心

Spark性能优化 - 云架构中心

RES09-03 重试需要避免造成流量压力 - 云架构中心

问题和检查项 - 云架构中心

卓越运营支柱 - 云架构中心

SEC10-04 安全事件演练 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线