搜索_华为云

问题和检查项 - 云架构中心
问题和检查项 - 云架构中心

预留IP资源以便扩展和高可用 RES06您如何进行故障检测处理？故障模式分析面向所有故障进行检测支持亚健康检测 RES07 您如何监控应用系统资源？定义关键指标与阈值并监控日志统计监控监控到异常后发送消息通知监控数据存储和分析端到端跟踪请求消息 RES08 您如何减少依赖影响？减少强依赖项

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
性能效率支柱简介 - 云架构中心

对常见的性能问题进行分析，可以发现对于一个系统或组件来说，性能问题经常发生在以下方面：实体间通信或者调用处理（包括数据库）频繁调用函数、模块处理过程、数据组织等问题并行处理资源争用引起的延迟串行处理进程/线程间等待延迟父主题：性能效率支柱

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱
RES10-03 采用Grid架构 - 云架构中心

所确定的分区键，必须在所有API或命令中都能直接包含或可通过其他参数间接转换得到，以便能使用该分区键进行分区处理。按分区键进行分区处理时，需要确保对应分区能独立处理业务，尽可能避免或减少与其他分区的交互。确定分区数量与每个分区的大小，后续还存在增加分区的情况。需要综合考虑：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES10 故障隔离
Kafka性能优化 - 云架构中心
Kafka性能优化 - 云架构中心

poll.records 500 消费者一次能消费到的最大消息数量，默认为500，如果每条消息处理时间较长，建议调小该值，确保在max.poll.interval.ms时间内能完成这一批消息的处理。 max.poll.interval.ms 300000 两次消费拉取请求允许的最大时间

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 消息队列性能优化
RES11-03 长稳测试 - 云架构中心
RES11-03 长稳测试 - 云架构中心

负载测试以评估系统稳定性。风险等级高关键策略模拟各种业务场景进行测试。持续自动测试。测试结果发生偏差时自动告警，以便及时定位和处理。父主题： RES11 可靠性测试

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
RES10-01 应用控制平面与数据平面隔离 - 云架构中心

RES10-01 应用控制平面与数据平面隔离通常应用的数据平面处理业务，比较重要，可用性要求比较高，而控制平面不直接处理业务，因此其故障时不应该影响业务系统。风险等级高关键策略应用控制平面与数据平面隔离，避免控制系统故障影响业务。数据平面所在业务系统的故障恢复可不依赖

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES10 故障隔离
RES13-03 过载检测与流量控制 - 云架构中心

当应用系统发生过载时，可能会导致系统疲于处理请求而无法有效提供服务，因此需要进行过载检测并进行流量控制。风险等级高关键策略过载控制(也称流控)指系统处于过载时，通过限流、降级、熔断、弹性伸缩等手段，使系统保证部分或者全部额定容量业务成功处理的控制过程；典型过载控制方法定义如下：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
RES02-03 定期进行备份数据恢复 - 云架构中心

通过定期恢复测试，可以验证备份数据的完整性与恢复处理过程是否可用，且数据丢失时间以及恢复时间符合数据的RPO与RTO指标要求。风险等级高关键策略定期执行备份数据恢复，以验证备份的完整性。为了避免备份恢复对生产业务造成影响，可以构建一个测试环境，并使用已有的备份数据进行恢复处理。华为云云服务提供了

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES02 备份
RES09-01 API及命令调用需要设计为可重试 - 云架构中心

RES09-01 API及命令调用需要设计为可重试在进行重试处理时，API及命令调用会重复发送，服务方会多次重复执行，需要保证重复执行多次的结果不变。风险等级高关键策略应用系统在设计时，应使操作具有幂等性，也就是允许一个操作连续执行两次或多次时，应该与单次调用产生的结果

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES09 故障重试
设计原则 - 云架构中心
设计原则 - 云架构中心

采取共享资源的设计，通过协作减少争用延时从而改善整体性能；如多个进程可以从一个数据库的同一部分读取。并行处理：当并行处理过程的增速能抵消通信开销和资源争用延迟时，执行并行处理。分散负载原则：通过在不同时间或者不同位置处理冲突负载，从而分散负载：将资源划分为成一些相对独立的小资源组，不同进程/线程可以独

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱
PERF03-02 选择合适规格的虚拟机和容器节点 - 云架构中心

不同应用对资源需求不同，例如：功耗密集型业务（如高性能计算、人工智能、深度学习等场景）主要就是消耗计算维度的容量。内存密集型业务（如大数据处理、图像/视频处理、游戏开发、数据库等场景）主要消耗内存和存储维度的容量。存储密集型业务（如大型数据库、大数据分析、大规模文件存储、编译构建等场景）可能会比较消耗存储的带宽。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适的计算资源
RabbitMQ性能优化 - 云架构中心
RabbitMQ性能优化 - 云架构中心

了。如何确定消息大小如何选择发往RabbitMQ的消息长度是一个常见问题。记住，每秒钟发送的消息数比消息大小更容易达到瓶颈。虽然发送大消息不是一个好的做法，但是发送多条小的消息也可能不是一个好的选择。更好的方法是生产者把多条小消息封装成一条大消息，然后由消费者来拆开处理。然而

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 消息队列性能优化
卓越运营支柱简介 - 云架构中心

定性运维体系，让研发团队将更多时间用在构建让客户受益的新功能上，减少用于维护和处理突发事件的时间，从而带来运行良好的系统和平衡的工作负载，尤其是卓越的客户体验。卓越运营支柱融合了这些优秀实践，聚焦如何正确地构建软件，高效地运维软件，持续提供卓越的客户体验，包含：组织团队、设计工作

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
OPS04-02 采用持续部署模型 - 云架构中心

部署到更大的组，直到所有用户群体都运行新版本。另一种常见的部署模型是蓝绿部署，通过部署了两组相同的工作负载实例，分别处理完整的生产负载。第一个（蓝色）实例处理所有工作负载。第二个（绿色）实例已使用新功能进行更新并进行了内部测试。经过内部测试后，生产流量的子集从蓝色实例路由到绿色

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS04 自动化构建和部署流程
SEC01-01建立安全管理团队 - 云架构中心

些政策和流程，确保安全管理的一致性和有效性。建立应急响应计划：开发和测试应急响应计划，以应对安全事件和紧急情况。团队应清楚知道如何应对安全威胁和处理安全事件。父主题： SEC01 云安全治理策略

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 云安全治理策略 > SEC01 云安全治理策略
缓存性能优化 - 云架构中心
缓存性能优化 - 云架构中心

缓存性能优化以下章节我们结合一些具体建议和案例来说明如何针对缓存的使用进行性能优化。 Redis使用规范如下的规范可以帮助我们在系统运行过程中，尽可能减少遇到redis不稳定或异常的概率，保证系统的长稳运行。业务使用规范原则原则说明级别备注就近部署业务，避免时延过大

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
OPS01-02 规划标准化的运维组织 - 云架构中心

梯型运维支持团队，一线受理客户的服务请求，第一时间将大部分的服务请求闭环。二线处理一线升级的服务请求和监控发现的客户的问题，按照SLA完成闭环，涉及到软件版本缺陷类问题升级到三线进行解决，大部分时间处理告警、事件和故障的恢复，其余时间开展转维验收、应急预案与演练等主动运维活动，对

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS01 建立持续改进的团队文化和标准化的运维体系
概述 - 云架构中心
概述 - 云架构中心

本章节介绍常用云服务的可靠性功能与故障模式，以便应用系统能充分利用云服务提供的可靠性能力，提升应用系统的可靠性，并能针对云服务的常见故障模式，进行故障恢复处理，以便最大限度减少故障，并能从故障中恢复。父主题：云服务可靠性介绍

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍
HIVE优化 - 云架构中心
HIVE优化 - 云架构中心

请参考对应组件的调优。本文档重点讨论上述的1，2，3部分的性能调优的内容，并结合MapReduce/Spark的进行调优说明。批处理业务批处理主要特点是耗时时间长，消耗的资源比较多，主要的调优和设计推荐如下：尽量使用ORC File，配上合适的压缩算法，主要可选的压缩

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
OPS08-02 进行事故复盘和改进 - 云架构中心

Review（回顾）：完整记录故障的发生、发现、根因定位、决策、处理、预案执行、回滚、故障解决等的关键人与关键时间点，保证信息尽可能的客观、准确。 Analyze（分析）：分析故障的根本原因及故障处理过程中优化点。 Summary（总结）：总结本次故障及处理故障的过程。进行故障定性、故障定责及总结本次故障带来的经验教训并举一反三。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS08 度量运营状态和持续改进

总条数： 138

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

问题和检查项 - 云架构中心

性能效率支柱简介 - 云架构中心

RES10-03 采用Grid架构 - 云架构中心

Kafka性能优化 - 云架构中心

RES11-03 长稳测试 - 云架构中心

RES10-01 应用控制平面与数据平面隔离 - 云架构中心

RES13-03 过载检测与流量控制 - 云架构中心

RES02-03 定期进行备份数据恢复 - 云架构中心

RES09-01 API及命令调用需要设计为可重试 - 云架构中心

设计原则 - 云架构中心

PERF03-02 选择合适规格的虚拟机和容器节点 - 云架构中心

RabbitMQ性能优化 - 云架构中心

卓越运营支柱简介 - 云架构中心

OPS04-02 采用持续部署模型 - 云架构中心

SEC01-01建立安全管理团队 - 云架构中心

缓存性能优化 - 云架构中心

OPS01-02 规划标准化的运维组织 - 云架构中心

概述 - 云架构中心

HIVE优化 - 云架构中心

OPS08-02 进行事故复盘和改进 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线