搜索_华为云

常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 ELB的并发连接数/新建连接数/带宽使用率过高检测：通过CES监控ELB的并发连接数/新建连接数/带宽使用率。恢复：根据业务情况，采用独享型负载均衡器，并手工调整ELB负载均衡器规格。父主题： ELB弹性负载均衡

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ELB弹性负载均衡
OPS06-02 定义可观测对象 - 云架构中心

OPS06-02 定义可观测对象风险等级高关键策略客户可感知的观测对象分类如下：可观测分层功能 / 主要指标 IT 资源监控 IT 资源监控对 IT 资源的性能和容量进行监视和报告，确保您的业务稳定可靠运行应用监控应用监控基于应用资源管理对资源实行从应用、业务组件

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
OPS06-05 实施依赖项遥测 - 云架构中心

OPS06-05 实施依赖项遥测风险等级高关键策略依赖项遥测可以监控工作负载所依赖的外部服务和组件的运行状况及性能。提供有关与 DNS、数据库或第三方 API 等依赖项相关的可访问性、超时及其他关键事件的高价值指标采集。当对应用程序进行检测，以发布有关这些依赖项的指标、日

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
HIVE优化 - 云架构中心
HIVE优化 - 云架构中心

HIVE优化概述 Hive架构 Hive提供了Hadoop的SQL能力，主要参考标准的SQL，Hive进行了部分的修改，形成了自己的特有的SQL语法HQL（Hive SQL），更加适合于Hadoop的分布式体系，该SQL目前是Hadoop体系的事实标准。 Hive调优用户输入

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
COST07-02 释放闲置资源 - 云架构中心

COST07-02 释放闲置资源风险等级中关键策略持续监控资源的闲置情况（如ELB无流量，EVS盘无挂载，EIP没有绑定到虚机），释放资源，或者监控资源使用只是在某个固定的时间(如每天的十二点，每个周末），可以使用自动化的方式定期申请资源，使用后释放相关服务和工具华为

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST07 管理和优化资源
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 BMS的CPU /内存/磁盘容量/磁盘IOPS使用率过高检测：通过CES监控CPU/内存/磁盘容量/磁盘IOPS使用率恢复：根据业务情况，更换规格更高的BMS实例或增加BMS实例进行负荷分担。应用层进行过载保护，保障优先业务的运行。连接后端BMS失败检测：网络连接失败。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > BMS裸金属服务
OPS01-02 规划标准化的运维组织 - 云架构中心

请求和监控发现的客户的问题，按照SLA完成闭环，涉及到软件版本缺陷类问题升级到三线进行解决，大部分时间处理告警、事件和故障的恢复，其余时间开展转维验收、应急预案与演练等主动运维活动，对现网的稳定性和可用性负责。三线聚焦解决软件版本缺陷问题。此外也可以使用DevOps模式，由开发

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS01 建立持续改进的团队文化和标准化的运维体系
PERF02-01 定义性能目标 - 云架构中心

客户反馈对于任何组织都至关重要，我们非常重视客户声音及客户满意度，并将其视为我们持续改进的指南。我们会定期收集和分析客户的反馈，将客户反馈纳入技术基准和持续优化流程，了解客户的需求和期望的变化，以便我们可以根据客户的需求和期望进行优化，并相应地调整性能目标。父主题：性能规划

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF02 性能规划 > 性能规划
OPS05-03 定义变更流程 - 云架构中心

变更审批流程可由多人进行组合，包括：业务负责人、团队TL、技术TL等，变更涉及的人员可根据变更的影响程度以及影响范围等因素确定。变更执行：通过发起时确认的执行人来进行执行工作的分派，以确保执行变更的是与变更内容相关的技术人员，从而确保变更的准确执行。变更验证：在变更完成后，对

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS05 运维准备和变更管理
COST01 规划成本优化相应的组织机构和流程 - 云架构中心

COST01 规划成本优化相应的组织机构和流程 COST01-01 规划企业组织，将组织结构，流程和成本管理相匹配 COST01-02 规划IT治理体系，提高管理效率 COST01-03 明确团队责任，建立和维护成本意识文化 COST01-04 指定云资源管理策略和相应的权限管理机制

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱
OPS01 建立持续改进的团队文化和标准化的运维体系 - 云架构中心

OPS01 建立持续改进的团队文化和标准化的运维体系 OPS01-01 建立持续学习和改进的文化 OPS01-02 规划标准化的运维组织 OPS01-03 规划标准化的运维流程和运维工具父主题：卓越运营支柱

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
RES08-01 减少强依赖项 - 云架构中心

RES08-01 减少强依赖项系统内组件之间强依赖时，一个组件故障会对其他组件造成直接影响，影响系统可用性。风险等级中关键策略可以通过以下技术将强依赖项转换为非强依赖项：提高关键依赖项的冗余级别，降低该关键组件不可用的可能性。与依赖项的通信采用异步消息并支持超时重试，或发布/

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES08 依赖减少与降级
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

可靠性功能数据持久性 OBS通过存储介质的慢盘/坏道检测、AZ内设备和数据冗余、AZ之间数据容灾、跨区域复制等技术方案，提供针对介质、服务器、机柜、数据中心和区域的多级可靠性保障。其数据持久性高达99.9999999999%（12个9），可用性高达99.995%，远高于传统架构。详见“OBS的持久性和可用性如何

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > OBS对象存储服务
RES13-01 采用自动弹性扩缩容 - 云架构中心

采用自动弹性扩缩容当系统突发流量时，通过自动弹性扩容，可减少业务中断影响。风险等级高关键策略弹性扩缩容需要通过业务处理逻辑与数据分离、状态外置等技术手段支撑系统处理能力的快速增加或减少。系统扩容和缩容的处理方式有两种，一种是改变单机的处理能力，包括CPU、内存、存储等，称之为纵向伸缩

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
RES10-03 采用Grid架构 - 云架构中心

RES10-03 采用Grid架构采用Grid架构，可将应用系统内的工作负载的故障影响限制在有限Grid业务单元中。风险等级高关键策略应用系统采用多个功能相同的Grid业务单元，每个Grid业务单元具备完整业务功能，处理整个业务负载中的一个子集，不涉及与其他Grid业务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES10 故障隔离
RES13-06 压力负载测试 - 云架构中心

RES13-06 压力负载测试通过压力测试，可衡量系统的弹性扩容能力是否能满足业务要求。风险等级高关键策略参见“RES11-02 压力负载测试”章节。父主题： RES13 过载保护

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

可靠性功能集群HA RDS服务支持HA主备高可用架构，故障秒级自动切换。数据持久性 RDS数据持久性高达99.9999999%，保证数据安全可靠，保护业务免受故障影响。数据备份和恢复 RDS支持每天自动备份数据，备份都是以压缩包的形式自动存储在对象存储服务（Object Storage

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > RDS云数据库
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 RDS的CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率过高检测：通过CES监控CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。开启存储空间自动扩容，以便在磁盘容量不足时自动扩容。应用层进行过载保护，保障优先业务的运行。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > RDS云数据库
RES01-02 应用组件多位置部署 - 云架构中心

RES01-02 应用组件多位置部署应用组件需要部署在多个数据中心，以避免单个数据中心故障而导致业务中断。风险等级高关键策略可根据不同需求，将应用的数据和资源部署在多个位置：应用多AZ部署：应用应尽可能部署在多个可用区，避免由于单个可用区故障而导致所有业务中断。应用

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES01 冗余
RES10-02 应用系统多位置部署 - 云架构中心

RES10-02 应用系统多位置部署通过将应用系统部署在多个位置，可以避免由于一个位置的基础设施故障而导致系统不可用。风险等级高关键策略将应用系统的数据和资源部署在多个AZ，可避免单个AZ故障影响业务。对于可用性要求较高的应用系统，可部署在多个Region，避免单个Region故障影响业务。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES10 故障隔离

总条数： 381

上一页
1
...
10
11
12
...
20
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

常见故障模式 - 云架构中心

OPS06-02 定义可观测对象 - 云架构中心

OPS06-05 实施依赖项遥测 - 云架构中心

HIVE优化 - 云架构中心

COST07-02 释放闲置资源 - 云架构中心

常见故障模式 - 云架构中心

OPS01-02 规划标准化的运维组织 - 云架构中心

PERF02-01 定义性能目标 - 云架构中心

OPS05-03 定义变更流程 - 云架构中心

COST01 规划成本优化相应的组织机构和流程 - 云架构中心

OPS01 建立持续改进的团队文化和标准化的运维体系 - 云架构中心

RES08-01 减少强依赖项 - 云架构中心

可靠性功能 - 云架构中心

RES13-01 采用自动弹性扩缩容 - 云架构中心

RES10-03 采用Grid架构 - 云架构中心

RES13-06 压力负载测试 - 云架构中心

可靠性功能 - 云架构中心

常见故障模式 - 云架构中心

RES01-02 应用组件多位置部署 - 云架构中心

RES10-02 应用系统多位置部署 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线