搜索_华为云

常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

恢复：根据业务情况，更换规格更高的BMS实例或增加BMS实例进行负荷分担。应用层进行过载保护，保障优先业务的运行。连接后端BMS失败检测：网络连接失败。恢复：至少部署2个后端BMS。对于无状态业务，配置ELB弹性负载均衡保障业务可靠性；对于有状态业务，由应用层实现多实例高可用。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > BMS裸金属服务
组织级参考架构 - 云架构中心
组织级参考架构 - 云架构中心

安全规则和安全资源，为成员账号设置安全配置基线，对整个企业的信息安全负责安全管理团队统一部署具备跨账号安全管控的服务，如安全云脑SecMaster、企业主机安全HSS、数据安全中心DSC、数据加密服务DEW、云证书服务CCM、漏洞管理服务CodeArts Inspector、配置审计Config等

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 参考架构
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

/内存/带宽/数据库连接数使用率过高”的处理。对于非暂行性故障，应用层需要能回退到原始数据源进行处理，避免由于缓存故障而导致业务无法运行。读写DCS概率性失败检测：读写失败。针对低概率超时错误，是Redis使用的正常现象。Redis使用受到网络传输、客户端设置超时时间等因素影响，可能出现单个请求超时问题。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
HIVE优化 - 云架构中心
HIVE优化 - 云架构中心

影响到Hive的性能，如每个任务的大小，任务与资源分配均匀度，任务拆分合理度等。 HDFS：最底层的IO读也是性能的关键，主要考虑的指标是读取和写入的性能，还包括块大小合理设置等。其中MapReduce/Spark/HDFS组件有自己独立的调优手册及文档，请参考对应组件的调优。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
RES13-05 资源自动扩容考虑了配额限制 - 云架构中心

RES13-05 资源自动扩容考虑了配额限制当应用系统在资源不足自动扩容时，需要考虑配额的限制，若配额不足，会导致自动扩容失败。风险等级高关键策略华为云为防止资源滥用，限定了各服务资源的配额，对用户的资源数量和容量做了限制。如您最多可以创建多少台弹性云服务器、多少块云硬

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
OPS05-02 进行变更风控 - 云架构中心

措施削减或规避风险，保障变更成功。变更风险指现网各要素增、删、改及状态改变（如版本迭代、配置改变、节点扩缩容等）时引发的业务中断风险及变更失败可能导致的业务受损风险。设计建议变更风控衡量指标：变更风控衡量指标为变更导致事件密度和变更引入重大事件数。变更导致事件密度定义：每月

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS05 运维准备和变更管理
设计原则 - 云架构中心
设计原则 - 云架构中心

处理量大辐增加，性能大辐下降。共享资源：采取共享资源的设计，通过协作减少争用延时从而改善整体性能；如多个进程可以从一个数据库的同一部分读取。并行处理：当并行处理过程的增速能抵消通信开销和资源争用延迟时，执行并行处理。分散负载原则：通过在不同时间或者不同位置处理冲突负载，从

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱
RES05-01 网络连接高可用 - 云架构中心

性，但检测到失败时需要尽快切换到正常路径。公有云组网场景可通过多EIP 弹性IP及DNS域名解析实现网络连接的高可用；对可用性要求较高的场景，需要支持智能DNS功能，能对EIP进行异常监控和自动切换；此外DNS自身也需要冗余容错，避免由于DNS故障而导致域名解析失败，业务中断。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES05 网络高可用
RES07-02 日志统计监控 - 云架构中心

计分析的内容可以是统计一定时间段内某些关键字出现的次数。风险等级中关键策略日志关键字与出现次数阈值需要合理设置，以免监控信息不正确。日志信息（如关键字或出现频率）发生变化时，需要及时更新告警规则。相关云服务和工具云日志服务 LTS 父主题： RES07 监控告警

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
RES14-02 自动化变更 - 云架构中心

tructure as a Code；以解决手工部署中易于出错、依赖个人能力，手工配置中变更无法跟踪、难以回滚等难题。风险等级高关键策略使用配置管理工具进行变更：集中管理配置信息，发现和记录配置变化情况，快速识别变更影响范围。采用自动化变更流程：帮助组织规划和自动化变更

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES14 配置防差错
Spark性能优化 - 云架构中心
Spark性能优化 - 云架构中心

优化代码逻辑：在进行Spark参数调优之前，要进行相应的规划设计，优化代码逻辑。 Spark任务跑的比较慢，cpu利用率低：检测室executor线程不能全部吃满，此时应减少每个executor的core数量，增加executor个数，同事增加partition个数。任务容易出现内存溢出：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
SEC08-02 主动通知数据主体 - 云架构中心

主动通知数据主体主动通知数据主体是指数据控制者主动向数据主体（个人）提供信息，告知其数据处理活动的相关信息，例如数据收集的目的、数据处理的方式、数据使用的范围、数据存储的期限等。这种通知通常以隐私政策、用户协议、提示信息等形式呈现。风险等级中关键策略主动通知数据主体的重要性在于：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 数据安全与隐私保护 > SEC08 数据隐私保护
成本优化云服务介绍 - 云架构中心

可帮助您收集华为云成本和使用量的相关信息、探索和分析华为云成本使用情况、监控和跟踪华为云成本，及时了解云支出的趋势和动因，减少异常支出，持续成本优化。费用中心为您提供财务信息、发票、合同、续费、退订和变更等服务，有助于更好的了解您的消费信息。同时费用中心还提供余额预警、资源包预警等服务，可以帮助您及时了解支出情况，

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱
设计原则 - 云架构中心
设计原则 - 云架构中心

国际标准化组织（ISO）对计算机系统安全的定义为：确保信息资产（包括硬件、软件、网络、数据等）受到保护，以确保其机密性、完整性和可用性。计算机系统安全的目标是保护信息系统免受未经授权的访问、使用、披露、破坏、修改、中断或不可用的威胁，同时确保信息系统能够持续地提供服务。系统安全的基本要素

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱
SEC09-02 安全事件记录及分析 - 云架构中心

异常行为的识别和分析。基于安全事件进行攻击链分析和攻击溯源, 包含攻击的各个路径，初始访问、执行、持久化、权限提升、防御绕过、凭证访问、信息收集、横向移动、数据采集、命令控制、数据窃取和影响破坏等。可基于流批一体化平台，支持在线、近线和离线的各种异常行为分析模型的构建，包含身

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC09 安全感知及分析
通过AOM助力系统运维能力提升，降低运维成本与难度 - 云架构中心

障零切换，过程中，客户自建运维平台能力较为欠缺，不足以满足运维需要无法采集云服务指标信息：客户自建运维体系无法采集到云服务等场景的指标信息，不能满足大屏展示需要告警通知能力不足：自建运维平台告警通知能力不能完全满足多场景通知的需要，且没有告警降噪能力解决方案：业务价值：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 参考案例
可用度及SLO - 云架构中心
可用度及SLO - 云架构中心

的时长要求。针对应用系统内薄弱环节进行增强：当云服务SLA无法满足要求时，需要应用层进行额外的保护和增强。通过冗余提升可用度：包括组件冗余（负载均衡集群），故障回退冗余（fail-back，例如使用DMS访问失败时暂时切换到SMN）。父主题：可用性目标定义

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念 > 可用性目标定义
设计原则 - 云架构中心
设计原则 - 云架构中心

极应对系统中隐藏的问题或者将问题推给了其他组织，部门。最终，这种文化上的高压导致整个组织和运维流程的僵化，以及系统不能持续迭代更新之后的代码、架构腐化，最终导致无法运维的系统。故而，文化上，惩前毖后，应重在总结经验，明确改进责任主体组织，不责怪个人。在总结经验上，应该将相关经

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

根据业务情况，手工变更规格以扩展资源。开启存储空间自动扩容，以便在磁盘容量不足时自动扩容。应用层进行过载保护，保障优先业务的运行。连接后端RDS失败检测：连接失败。恢复：应用层进行重试，以应对暂时性故障，如RDS实例正在进行主备切换时；应用故障重试处理可参考“故障重试”。当RDS实例由

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > RDS云数据库
OPS06-04 规范化应用日志 - 云架构中心

关键策略对于一个系统来说，日志是非常重要的。它可以记录在系统中发生的一切，包括成功的操作、错误的操作、警告信息等等。因此，日志记录是可观测性设计中最基本的需求之一。通过将事件和错误信息记录到日志文件或数据库中，可以方便地进行故障排除和问题诊断。但是，仅仅记录日志并不足够，还需要对日志进

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系

总条数： 124

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

常见故障模式 - 云架构中心

组织级参考架构 - 云架构中心

常见故障模式 - 云架构中心

HIVE优化 - 云架构中心

RES13-05 资源自动扩容考虑了配额限制 - 云架构中心

OPS05-02 进行变更风控 - 云架构中心

设计原则 - 云架构中心

RES05-01 网络连接高可用 - 云架构中心

RES07-02 日志统计监控 - 云架构中心

RES14-02 自动化变更 - 云架构中心

Spark性能优化 - 云架构中心

SEC08-02 主动通知数据主体 - 云架构中心

成本优化云服务介绍 - 云架构中心

设计原则 - 云架构中心

SEC09-02 安全事件记录及分析 - 云架构中心

通过AOM助力系统运维能力提升，降低运维成本与难度 - 云架构中心

可用度及SLO - 云架构中心

设计原则 - 云架构中心

常见故障模式 - 云架构中心

OPS06-04 规范化应用日志 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线