搜索_华为云

OPS07-03 支持事件管理 - 云架构中心

关键策略事件(incidents)是需要干预的事情。当发生事故(incidents)时，通过流程来处理。如何与团队沟通活动的状态？谁负责响应处置？使用哪些工具来缓解该事件？这些都是流程中需要回答的问题，并需要获得可靠的响应过程。流程必须中心化，并且可供参与工作负载的任何人使用。如果没有wiki

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS07 进行故障分析和管理
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

应用层进行重试，以应对暂时性故障，如网络拥塞；应用故障重试处理可参考“故障重试”。应用层进行过载保护，保障优先业务的运行。 OBS对象上传/下载失败检测：对象上传/下载失败。恢复：应用层进行重试，以应对暂时性故障，如网络拥塞；应用故障重试处理可参考“故障重试”。当OBS桶由于过载导致网络限制时，可参考“OBS桶流量过载”的处理。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > OBS对象存储服务
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

995%，远高于传统架构。详见“OBS的持久性和可用性如何?”。数据备份和恢复 OBS支持多版本控制，可以在一个桶中保留多个版本的对象，以便方便地检索和还原各个版本，在意外操作或应用程序故障时快速恢复数据。跨AZ容灾在创建桶时，数据冗余存储策略可选择多AZ存储，数据将冗余存储至多个AZ中，可靠性更高。跨Region容灾

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > OBS对象存储服务
SEC10-05建立复盘机制 - 云架构中心

建立安全事件复盘机制可以帮助团队从过去的安全事件中学习经验教训，并改进未来的安全措施。风险等级中关键策略确定复盘的目的：在进行复盘之前，明确目的是非常重要的。确定您希望从这次安全事件中学到什么，以及如何改进未来的安全措施。收集事实和数据：收集关于安全事件的所有相关信息和数据，可以用5

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC10 安全事件响应
问题和检查项 - 云架构中心
问题和检查项 - 云架构中心

检查项/最佳实践 PERF01 如何确立流程与规范？全生命周期性能管理应用性能编程规范 PERF02 如何进行性能规划？定义性能目标容量规划 PERF03 如何进行性能建模？选择合适类型的计算云服务选择合适规格的虚拟机和容器节点使用弹性伸缩选择合适类型的网络云服务选择合适类型的存储云服务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱
RabbitMQ性能优化 - 云架构中心
RabbitMQ性能优化 - 云架构中心

控制优先级队列的使用每一个优先级会在Erlang VM中使用一个内部队列，这会消耗一定的资源。大多数场景下，使用最多5个优先级就够了。如何确定消息大小如何选择发往RabbitMQ的消息长度是一个常见问题。记住，每秒钟发送的消息数比消息大小更容易达到瓶颈。虽然发送大消息不是一个好的做法，

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 消息队列性能优化
PERF02-02 容量规划 - 云架构中心

求。使预测与工作负载目标保持一致为了确保预测与工作负载目标保持一致，需要定期对预测进行评估，比较实际结果与预测结果，根据需要对容量预测模型进行调整。例如新的应用或服务添加到系统中，那么容量预测模型就需要考虑这些新的容量需求。预测与工作负载目标的一致性，可确保充分预配资源，防止资源浪费或工作负载过载。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF02 性能规划 > 性能规划
概念表 - 云架构中心
概念表 - 云架构中心

要的最短时间周期。业界对韧性没有统一的定义。狭义韧性，指的是自动或快速从故障中恢复运行的能力；而广义韧性，除了从故障中恢复运行的能力外，还包括故障容忍能力。故障容忍（fault tolerance，简称“容错”），是使系统在其某些组件中出现一个或多个故障时能够继续提供服务的能力

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念
COST08-01 按地域规划应用架构 - 云架构中心

按地域规划应用架构风险等级中关键策略国家已启动“东数西算”工程，将东部发达地区的数据，传输到西部算力资源丰富的地区进行运算、存储。西部数据中心综合成本有明显优势，低PUE低能耗，如贵阳资源价格比广州上海等区域低10%左右。企业可将灾备、离线分析、转码、运维等对网络要求低的系统部署在贵阳、乌兰察布，降低资源成本。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST08 进行架构优化
SEC10-01 建立安全响应团队 - 云架构中心

SEC10-01 建立安全响应团队建立安全事件响应团队，明确各角色与职责。风险等级高关键策略安全事件响应团队一般包含如下角色及职责：安全响应专家：主导网络安全事件调查，负责对事件进行定级、通报、攻击溯源以及确定影响范围，制定应急处置措施，推动服务控制风险。攻击溯源专家

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC10 安全事件响应
PERF05-04 大数据场景资源优化 - 云架构中心

负载均衡：通过负载均衡技术，将数据和计算任务均匀地分配到多个节点上，以避免单个节点过载，提高系统的可用性和性能。数据分区：将数据按照一定的规则分成多个分区，以便更好地进行数据处理和计算。网络优化：通过优化网络带宽、延迟等参数，以提高数据传输的速度和效率。数据清洗和预处理：在进行大数据处理之前，对数据进行清洗

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF05 性能优化 > 资源优化
OPS03-03 进行性能压测 - 云架构中心

作。配置测试：指在一定的软件、硬件及网络环境下，模拟一定数量的虚拟用户运行一种或多种业务，将测试结果作为基线数据，在系统调优或系统评测的过程中，通过运行相同的业务场景比较测试结果，确定调优的结果是否达到预期效果或者为系统的选择提供决策数据。在性能压测过程中，需要模拟或者还原现

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS03 完备的测试验证体系
COST01-04 指定云资源管理策略和相应的权限管理机制 - 云架构中心

中心或 FinOps 团队需要为各个账号环境实施与策略一致的组和角色，控制每个组中谁可以创建、修改或停用实例和资源。同时依据企业的业务环境，创建统一的资源/成本视图，统一管理企业的账单和成本。相关服务和工具客户可通过统一身份认证服务IAM的细粒度权限管理，精细化控制账号下用户的资源访问权限，实施最小授权。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST01 规划成本优化相应的组织机构和流程
设计原则 - 云架构中心
设计原则 - 云架构中心

余的组合（例如：1+1冗余、n+1冗余、N-Way冗余等）异地容灾：例如，两地三中心，保证灾难的情况也可以提供业务。数据冗余：可以通过定期备份和多副本备份等方式实现以提高数持久度，并确保数据一致性。冗余的增加，意味着成本的增加；因此在应用高可用设计时需要综合考虑冗余对成本的影响。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
什么是应用韧性 - 云架构中心
什么是应用韧性 - 云架构中心

什么是应用韧性应用韧性是应用系统在运行过程中面对各种异常场景，如基础设施故障（如数据库异常）、外部攻击（如网络DDoS攻击超出预定限额流量）、外部依赖故障（如依赖系统访问超时或不可用）、地域灾难（如大面积停电、洪水）等，仍能提供和维持可接受的服务水平的能力，对系统至关重要。系统韧性设计主要涉及以下两个方面：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念
SEC01-04 分隔工作负载 - 云架构中心

离。分隔工作负载在云环境中是非常重要的。从安全治理角度，主要基于以下几个理由：安全性：分隔工作负载可以降低潜在的安全风险。通过将不同的工作负载隔离在独立的环境中，可以减少一种工作负载受到攻击或故障时对其他工作负载的影响。合规性：在一些行业和法规中，对数据隔离和访问控制有严格

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 云安全治理策略 > SEC01 云安全治理策略
人工智能性能优化 - 云架构中心

通过生成profiling中的summary文件对具体的算子进行分析，考虑算子层面向FA与MM算子方向优化。 2.路由规划加速最佳实践 ranktable路由规划是一种用于分布式并行训练中的通信优化能力，在使用NPU的场景下，支持对节点之间的通信路径根据交换机实际topo做网络路由亲和规划，

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
卓越架构技术框架简介 - 云架构中心

攻型运维，从关注自身网络转向关注客户应用，从系统维护工程师转向研发工程师，这个转型的过程对运维提出艰巨挑战的同时，也给每个组织和个人提供了难得的发展机会。华为云SRE过去构建了一些能力，也还在持续解决新的挑战，我们已经构建了一套质量管理机制、一套运维平台、一支全球专家队伍，更重要

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践
SEC09-03 实施安全审计 - 云架构中心

对数据操作实施监控相关云服务和工具云审计服务 CTS：用户开通CTS后，系统会自动创建一个追踪器，该追踪器会自动识别并关联当前租户所使用的所有云服务，并将当前租户的所有操作记录在该追踪器中。CTS服务具备对各种云资源操作记录的收集、存储和查询功能，可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC09 安全感知及分析
RES06-02 面向所有故障进行检测 - 云架构中心

系统的任何层次上进行，包括在一条内存总线上的cycle by cycle的比较，到最终发送到网络上结果的比较。时间检测：时间检测是故障检测的一种简单形式。如果一个事件预期应在某个时间段内发生，而却没有在该时间段发生，就检测到了一个故障。时间检测的一种特殊方法通常称为心跳方法。它

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES06 故障检测

总条数： 115

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

OPS07-03 支持事件管理 - 云架构中心

常见故障模式 - 云架构中心

可靠性功能 - 云架构中心

SEC10-05建立复盘机制 - 云架构中心

问题和检查项 - 云架构中心

RabbitMQ性能优化 - 云架构中心

PERF02-02 容量规划 - 云架构中心

概念表 - 云架构中心

COST08-01 按地域规划应用架构 - 云架构中心

SEC10-01 建立安全响应团队 - 云架构中心

PERF05-04 大数据场景资源优化 - 云架构中心

OPS03-03 进行性能压测 - 云架构中心

COST01-04 指定云资源管理策略和相应的权限管理机制 - 云架构中心

设计原则 - 云架构中心

什么是应用韧性 - 云架构中心

SEC01-04 分隔工作负载 - 云架构中心

人工智能性能优化 - 云架构中心

卓越架构技术框架简介 - 云架构中心

SEC09-03 实施安全审计 - 云架构中心

RES06-02 面向所有故障进行检测 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线