搜索_华为云

COST02-02 精细化预算管理和跟踪 - 云架构中心

团队、部门负责人或特定的成本管理团队。以便在警报触发时能够快速采取必要的措施，如优化资源、停止不必要的服务，或者针对某个部门，项目进行新购买云资源的限制等。相关服务和工具华为云提供了通用的预算管理工具，您可以根据企业实际规划的预算，用预算管理工具跟踪起来，并可以设置细粒度的过

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST02 实施预算规划管理机制
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

检测：生产消息失败恢复：应用层进行重试，以应对暂时性故障；应用故障重试处理可参考“故障重试”。当多次重试后仍无法写入成功，可将数据写入本地缓存，待服务可用后再写入实例。当实例由于过载导致网络限制时，可参考“CPU /内存/带宽使用率过高”的处理。父主题： DMS分布式消息服务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DMS分布式消息服务
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

后端服务器健康检查 ELB弹性负载均衡支持定期向后端服务器发送请求以测试其运行状态。当判断后端服务器健康检查异常后，就不会将流量分发到异常后端服务器，而是分发到健康检查正常的后端服务器，从而提高了业务的可靠性。当异常的后端服务器恢复正常运行后，负载均衡器会将其自动恢复到负载均衡服务中，承载业务流量。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ELB弹性负载均衡
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

可靠性功能数据备份和恢复使用CBR云备份服务可对BMS的所有云硬盘（系统盘和数据盘）进行备份，支持基于多云硬盘一致性快照技术的备份服务，并支持利用备份数据恢复裸金属服务器数据，最大限度保障用户数据的安全性和正确性，确保业务安全。详见“备份裸金属服务器”。集群HA 配合共享云

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > BMS裸金属服务
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式 ELB的并发连接数/新建连接数/带宽使用率过高检测：通过CES监控ELB的并发连接数/新建连接数/带宽使用率。恢复：根据业务情况，采用独享型负载均衡器，并手工调整ELB负载均衡器规格。父主题： ELB弹性负载均衡

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ELB弹性负载均衡
SEC10-02 制定事件响应计划 - 云架构中心

实施快速安全响应动作，隔离受影响的系统或账户、断开网络连接、停止服务、清除恶意文件、修复漏洞、替换受损系统并加固系统，确认所有威胁已经被完全清除，避免再次发生。制定恢复策略，逐步恢复受影响服务，确保数据和系统一致性，进行测试确保所有系统恢复正常运作。进行事件后分析，总结事件的起因、响应过程

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC10 安全事件响应
SEC04-02 控制网络流量的访问 - 云架构中心

需求，极简应用让用户快速灵活应对威胁。云防火墙服务是为用户业务上云提供网络安全防护的基础服务。 WAF：保护网站等Web应用程序免受常见Web攻击，保障业务持续稳定运行，满足合规和监管要求。 AAD：华为云DDoS防护提供全球化服务，以应对DDoS攻击挑战，可提供毫秒级攻击响应、

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC04 网络安全
OPS03-03 进行性能压测 - 云架构中心

数下系统响应时间及硬件设备或云服务的资源利用率，负载测试强调的是在一定的环境下系统能够达到的峰值指标。压力测试：指在一定的软件、硬件及网络环境下，模拟大量的虚拟用户向测试环境产生负载，使测试环境处于极限状态下并长时间连续运行，以测试硬件设备或云服务在高负载情况下是否能够稳定工作

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS03 完备的测试验证体系
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

/内存/磁盘容量/磁盘IOPS/数据库连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。开启存储空间自动扩容，以便在磁盘容量不足时自动扩容。应用层进行过载保护，保障优先业务的运行。连接后端RDS失败检测：连接失败。恢复：应用层进行重试，以应对暂时性故障，如RDS实

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > RDS云数据库
设计原则 - 云架构中心
设计原则 - 云架构中心

设计合适的故障恢复方案：自动恢复：对于影响业务的故障，系统应尽可能自动恢复自愈，如保护倒换、局部复位或系统服务等。优先恢复：优先对故障发生概率高、故障影响大的故障进行恢复。分级复位：提供分级复位设计，尽可能在更小级别进行复位，以减少对业务的影响。无耦合恢复：尽可能做到系统

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
OPS01-02 规划标准化的运维组织 - 云架构中心

应时间、服务级别目标（SLO) 或服务等级协议(SLA），同时应该记录团队间沟通信息，确保有足够的数据用于后续的改进。例如一种运维组织设计是：将运维组织分为一线、二线和三线阶梯型运维支持团队，一线受理客户的服务请求，第一时间将大部分的服务请求闭环。二线处理一线升级的服务请求和监

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS01 建立持续改进的团队文化和标准化的运维体系
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

/内存/磁盘容量/磁盘IOPS/数据库连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。开启自动扩缩容，以便在过载时自动扩容规格和/或只读节点。应用层进行过载保护，保障优先业务的运行。连接后端云数据库 TaurusDB失败检测：连接失败。恢复：应用层进行重试，以应对暂时性故障，如云数据库

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > 云数据库 TaurusDB云数据库
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

CCE集群支持3个Master节点高可用部署，确保集群的可靠性。数据备份和恢复为满足数据持久化的需求，CCE支持将云硬盘（EVS）创建的存储卷挂载到容器的某一路径下；CCE通过云硬盘EVS服务提供针对云硬盘的快照功能，当数据丢失时，可通过快照将数据完整的恢复到快照时间点。详见“快照与备份”。健康检查健

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > CCE云容器引擎
缓存性能优化 - 云架构中心
缓存性能优化 - 云架构中心

仍然正常提供服务。强制 DCS默认的逐出策略为volatile-lru，请根据业务需求选择。Redis支持的数据逐出策略以缓存方式使用Redis Redis事务功能较弱，不建议过多使用。建议事务执行完后，不可回滚。数据异常的情况下，支持清空缓存进行数据恢复。强制 Re

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
OPS04-03 基础设施即代码 - 云架构中心

标准操作程序中，清楚地记录人工步骤，并实现标准化，以确保安全、一致地执行任务。回收闲置资源：由于配置管理工具及其限制等原因，有时 IaC 工具无法自动删除资源。例如，假设需要从虚拟机迁移到 PaaS 服务，而 IaC 工具没有删除闲置资源的逻辑。如果忘记手动删除这些资源，这些资

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS04 自动化构建和部署流程
RES01-01 应用组件高可用部署 - 云架构中心

以便在一个实例故障时，应用可以自动故障切换和恢复业务。相关云服务和工具弹性云服务器 ECS 裸金属服务器 BMS 弹性负载均衡 ELB 云容器引擎 CCE 文档数据库服务 DDS 分布式缓存服务 DCS MapReduce服务 MRS 父主题： RES01 冗余

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES01 冗余
HIVE优化 - 云架构中心
HIVE优化 - 云架构中心

的资源使用情况。接入层指标的观测 Manger的服务->Hive服务状态页面可以查看到相关的HiveServer的连接数，HQL的执行成功的统计信息。 HiveMetaStore指标的观测在Manager的服务->Hive服务状态页面，查看HiveMetaStore当前的请求连接数量以及关键API性能。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
SEC03-02 按需分配合适的权限 - 云架构中心

Organizations：多账号场景使用Organizations云服务的服务控制策略（SCP）。组织管理账号可以使用SCP指定组织中成员账号的权限边界，限制账号内用户的操作。服务控制策略可以关联到组织、组织单元和成员账号。当服务控制策略关联到组织或组织单元时，该组织或组织单元下所有账号受到该策略影响。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC03 权限管理
Flink性能优化 - 云架构中心
Flink性能优化 - 云架构中心

性能衡量指标包含吞吐量、资源利用率、伸缩性。吞吐量：在相同资源环境下，执行相同计算任务，查看任务的完成速度。资源利用率：执行计算任务，查看在不同负载情况下，CPU、内存、网络的使用率。伸缩性： − 横向扩容带来的性能提升曲线：增加资源，执行相同计算任务，查看性能提升比率。 − 增加系统负担带来的性能下降曲

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
可用度及SLO - 云架构中心
可用度及SLO - 云架构中心

95%”。系统可用性目标通过服务等级目标（SLO）定义。不同的应用系统对可用性目标是不同的，明确应用系统的可用性目标，对于衡量应用系统的韧性至关重要。常见IT系统SLO示意如下： SLO 每年最大不可用时间典型IT服务 99% 3.65天批处理，后台任务，数据抽取 99.9% 8

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念 > 可用性目标定义

总条数： 255

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

COST02-02 精细化预算管理和跟踪 - 云架构中心

常见故障模式 - 云架构中心

可靠性功能 - 云架构中心

可靠性功能 - 云架构中心

常见故障模式 - 云架构中心

SEC10-02 制定事件响应计划 - 云架构中心

SEC04-02 控制网络流量的访问 - 云架构中心

OPS03-03 进行性能压测 - 云架构中心

常见故障模式 - 云架构中心

设计原则 - 云架构中心

OPS01-02 规划标准化的运维组织 - 云架构中心

常见故障模式 - 云架构中心

可靠性功能 - 云架构中心

缓存性能优化 - 云架构中心

OPS04-03 基础设施即代码 - 云架构中心

RES01-01 应用组件高可用部署 - 云架构中心

HIVE优化 - 云架构中心

SEC03-02 按需分配合适的权限 - 云架构中心

Flink性能优化 - 云架构中心

可用度及SLO - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线