搜索_华为云

通过AOM助力系统运维能力提升，降低运维成本与难度 - 云架构中心

障零切换，过程中，客户自建运维平台能力较为欠缺，不足以满足运维需要无法采集云服务指标信息：客户自建运维体系无法采集到云服务等场景的指标信息，不能满足大屏展示需要告警通知能力不足：自建运维平台告警通知能力不能完全满足多场景通知的需要，且没有告警降噪能力解决方案：业务价值：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 参考案例
SEC08-06 向第三方披露个人数据合规性 - 云架构中心

保护机制。用户个人数据转移给第三方前须经过用户同意，符合合法性原则。转移的目的和范围不能超出收集时所声明的目的和范围。必须保证个人数据的准确性、完整性和最新状态，保证在任何阶段和环节不能随意篡改、删除、滥用个人数据。输出者必须获得接收者的明确承诺，保证个人数据的完整性、准确性和安全性，防止滥用及不正当披露。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 数据安全与隐私保护 > SEC08 数据隐私保护
RES07-01 定义关键指标与阈值并监控 - 云架构中心

以下4个黄金指标，是针对大量分布式监控的经验总结，可以作为业务监控的参考，包括：延迟：注意需要区分请求成功的延迟和请求失败的延迟。流量：对系统业务负荷的监控。错误率：注意区分显示失败（如HTTP 500错误）和隐式失败（如HTTP 200中包含了错误内容）。饱和度：侧重在对系统中最为受限的瓶颈资源的监控。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
RES13 过载保护 - 云架构中心
RES13 过载保护 - 云架构中心

RES13 过载保护当系统流量超过一定阈值后，导致系统处于过载状态时，可能会导致部分请求失败，失败触发业务重试，会进一步增加系统的负荷，形成恶性循环，导致业务成功率远远低于系统的设计容量，甚至整体不可用。因此应用应该设计过载保护机制，使得在过载状态下依然可以保证一定比例设计容量的处理能力。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制
RES02 备份 - 云架构中心
RES02 备份 - 云架构中心

数据恢复到备份点。由于容灾通常对数据采用实时复制且没有多备份点，在主数据被误删或误改的情况下，错误数据会同步到备端，从而无法达到数据备份的效果，因此通常不能使用容灾来代替备份。备份恢复时的RPO指标（即数据丢失量），与最近一个备份时间点相关；不同类型的数据，允许丢失数据量可以

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

Pod将无法感知，也不会自动重启去恢复。最终导致虽然Pod状态显示正常，但Pod中的应用程序异常的情况。 Kubernetes提供了三种健康检查的探针：存活探针：livenessProbe，用于检测容器是否正常，类似于执行ps命令检查进程是否存在。如果容器的存活检查失败，集群会

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > CCE云容器引擎
COST05-02 建立可以量化的优化目标 - 云架构中心

升了业务对市场的响应时间，以及人员的效率。这部分也应该列入量化的内容。最后，优化的目标是使企业或者组织每一块钱的花费都能产生最大的效益。不能只专注于降低成本而忽略业务价值。设定一个明确的可量化的优化目标，有助于成本优化团队（上文中提到的云业务办公室、云卓越中心或 FinOps 团队）和决策层，利益相关方取得一致。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST05 优化指定策略和目标
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

文件；手动备份由用户触发，通常在执行业务系统维护、升级等高危操作进行，保存期限无限制。 DCS指定备份集恢复。恢复过程中，实例会有一段时间不能处理客户端的数据操作请求，当前数据将被删除，待恢复完成后存储原有备份数据。详见“备份与恢复说明”。跨AZ容灾 DCS提供的主备、Clu

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
数据库性能优化 - 云架构中心
数据库性能优化 - 云架构中心

N，并且要在CN运行不能下推的部分语句，会导致CN成为性能瓶颈（带宽、存储、计算等）。在进行性能调优的时候，应尽量避免只能选择第3种策略的查询语句。执行语句不能下推是因为语句中含有不支持下推的函数或者不支持下推的语法。一般都可以通过等价改写规避执行计划不能下推的问题。语句下推

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式弹性伸缩失败检测：查看弹性伸缩组的弹性伸缩活动历史。恢复：根据伸缩活动失败描述信息进行修复。父主题： AS弹性伸缩

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > AS弹性伸缩
RES14-04 提供runbook进行标准化变更 - 云架构中心

变更前需提供标准化runbook用于变更和回退，变更过程中严格按照runbook执行，在变更失败时根据runbook进行回退。风险等级高关键策略 runbook需涵盖变更前检查、变更操作、变更后检查及变更失败回退操作。父主题： RES14 配置防差错

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES14 配置防差错
RES15-03 自动化回滚 - 云架构中心

RES15-03 自动化回滚在升级或部署过程中出现异常，或检查/测试失败时，支持自动回滚，减少人工干预，避免回滚失败。风险等级高关键策略检测到异常后，可一键式回滚。回滚过程自动化完成。父主题： RES15 升级不中断业务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES15 升级不中断业务
PERF03-05 选择合适类型的存储云服务 - 云架构中心

存放的是文件，会以文件和文件夹的层次结构来整理和呈现数据。存放的是对象，可以直接存放文件，文件会自动产生对应的系统元数据，用户也可以自定义文件的元数据。存放的是二进制数据，无法直接存放文件，如果需要存放文件，需要先格式化文件系统后使用。访问方式在ECS/BMS中通过网络协议挂载使用，支持NFS和CIFS的网络

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适的存储云服务
PERF03-03 使用弹性伸缩 - 云架构中心

A可以调整应用的副本数，调整的副本数会改变当前负载占用的调度容量，从而实现调度层的伸缩。节点弹性伸缩：即资源层弹性，主要是集群的容量规划不能满足集群调度容量时，会通过弹出ECS资源的方式进行调度容量的补充。两个维度的弹性组件与能力可以分开使用，也可以结合在一起使用，并且两者之

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适的计算资源
RES10-03 采用Grid架构 - 云架构中心

路由层是系统唯一的一个共享组件，因此需要尽可能的稳定，减少修改。避免业务逻辑，保证尽可能的稳定，减少修改。由于爆炸半径大，需要足够轻，足够简单，但是不能太简单。某些情况，要考虑避免路由所有调用，有助于减少延迟，并减小路由层的规模。支持横向扩展，避免路由层成为性能瓶颈。提供Grid迁移

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES10 故障隔离
PERF02-01 定义性能目标 - 云架构中心

可以帮助我们更好地监控和管理性能，并采取优化措施。这不仅可以提高系统的性能，还可以提高用户满意度。比如购物网站，我们可以设定页面加载时间不能超过5秒，如果页面加载时间超过设定的阈值，我们就可以采取优化措施，例如优化图片大小、减少HTTP请求等，以提高页面加载速度。记录并公开性能目标

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF02 性能规划 > 性能规划
Spark性能优化 - 云架构中心
Spark性能优化 - 云架构中心

优化代码逻辑：在进行Spark参数调优之前，要进行相应的规划设计，优化代码逻辑。 Spark任务跑的比较慢，cpu利用率低：检测室executor线程不能全部吃满，此时应减少每个executor的core数量，增加executor个数，同事增加partition个数。任务容易出现内存溢出：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
RES06-01 故障模式分析 - 云架构中心

性问题，或者I类故障是所有/大部分功能丧失。II类故障指主要功能受影响。III类故障可简单理解为需要尽快修复的故障。通常来说，当一个故障不能被检测出来时，会认为这是一个故障“隐患”，相应的故障严酷度级别上升一级。标识系统中的所有组件及功能模块明确应用系统涉及的所有组件，以及外部依赖项，如提供者、第三方服务等。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES06 故障检测
设计原则 - 云架构中心
设计原则 - 云架构中心

极应对系统中隐藏的问题或者将问题推给了其他组织，部门。最终，这种文化上的高压导致整个组织和运维流程的僵化，以及系统不能持续迭代更新之后的代码、架构腐化，最终导致无法运维的系统。故而，文化上，惩前毖后，应重在总结经验，明确改进责任主体组织，不责怪个人。在总结经验上，应该将相关经

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
RES09-02 客户端需要根据综合评估是否要重试 - 云架构中心

客户端需要根据综合评估是否要重试当客户端请求超时或收到错误响应时，客户端需要决定是否重试；重试有助于客户端在请求失败时，通过重复消息来获得预期的结果，避免业务失败，但也会消耗更多的服务器时间来获取所需的成功响应。风险等级高关键策略请求超时，可能是链路闪断或其他临时性故障导致消息丢失，可以进行重试。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES09 故障重试

总条数： 92

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

通过AOM助力系统运维能力提升，降低运维成本与难度 - 云架构中心

SEC08-06 向第三方披露个人数据合规性 - 云架构中心

RES07-01 定义关键指标与阈值并监控 - 云架构中心

RES13 过载保护 - 云架构中心

RES02 备份 - 云架构中心

可靠性功能 - 云架构中心

COST05-02 建立可以量化的优化目标 - 云架构中心

可靠性功能 - 云架构中心

数据库性能优化 - 云架构中心

常见故障模式 - 云架构中心

RES14-04 提供runbook进行标准化变更 - 云架构中心

RES15-03 自动化回滚 - 云架构中心

PERF03-05 选择合适类型的存储云服务 - 云架构中心

PERF03-03 使用弹性伸缩 - 云架构中心

RES10-03 采用Grid架构 - 云架构中心

PERF02-01 定义性能目标 - 云架构中心

Spark性能优化 - 云架构中心

RES06-01 故障模式分析 - 云架构中心

设计原则 - 云架构中心

RES09-02 客户端需要根据综合评估是否要重试 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线