搜索_华为云

人工智能性能优化 - 云架构中心

人工智能性能优化 1.训练优化模型性能提升实践参数调优策略：调整模型flash attention、并行切分策略、micro batch size、重计算策略等参数。尽可能充分利用显存和算力，通过参数调优，初步优化性能。性能拆解参数调优后性能仍然与转商目标有较大的差距，需

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
RES12-05 应急恢复回溯 - 云架构中心

应急恢复回溯在业务进行应急恢复处理后，需要对事件进行回溯并进行优化，以避免故障的再次发生。风险等级高关键策略对问题进行定位和修复，优化产品能力，减少同类事件的发生。针对应急恢复过程进行总结，优化恢复过程。父主题： RES12 应急恢复处理

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
RES11-04 灾难演练 - 云架构中心
RES11-04 灾难演练 - 云架构中心

复时间符合数据的RPO与RTO指标要求。风险等级高关键策略灾难演练着重测试服务跨AZ或跨Region故障转移能力，验证系统的容灾能力以及面对灾难时的应对能力，涉及到多个团队间配合，通常作为专项开展。容灾演练可以帮助企业更好的验证RPO、RTO指标，及时发现和解决相关问题，提高系统的可用性和可靠性。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
RES13-01 采用自动弹性扩缩容 - 云架构中心

弹性扩缩容需要通过业务处理逻辑与数据分离、状态外置等技术手段支撑系统处理能力的快速增加或减少。系统扩容和缩容的处理方式有两种，一种是改变单机的处理能力，包括CPU、内存、存储等，称之为纵向伸缩；另一种是单机节点处理能力不变，通过增加节点的数量来改变系统的处理能力，称之为横向伸缩。系统设计时一般建议采用横

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
云服务性能优化介绍 - 云架构中心

云服务性能优化介绍缓存性能优化消息队列性能优化 Serverless性能优化数据库性能优化人工智能性能优化大数据性能优化父主题：性能效率支柱

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱
通过AOM助力系统运维能力提升，降低运维成本与难度 - 云架构中心

切换，过程中，客户自建运维平台能力较为欠缺，不足以满足运维需要无法采集云服务指标信息：客户自建运维体系无法采集到云服务等场景的指标信息，不能满足大屏展示需要告警通知能力不足：自建运维平台告警通知能力不能完全满足多场景通知的需要，且没有告警降噪能力解决方案：业务价值：降低

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 参考案例
SEC10-04 安全事件演练 - 云架构中心

安全事件演练是一种模拟性的活动，旨在让组织成员在一个模拟的安全事件场景下进行实际操作和应对，以测试和提高其应对安全事件的能力。通过安全事件演练，组织可以评估其安全事件响应计划的有效性，发现潜在的问题并进行改进，提高团队的准备性和反应能力。风险等级高关键策略按照“三化六防”（实战化、体系化、常态化，动态防御、主

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC10 安全事件响应
更多参考文档 - 云架构中心
更多参考文档 - 云架构中心

更多参考文档华为云零信任能力成熟度模型白皮书企业上云安全白皮书华为云安全白皮书华为云隐私保护白皮书华为云服务的安全特性华为云安全配置基线指南父主题：安全性支柱

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱
Spark性能优化 - 云架构中心
Spark性能优化 - 云架构中心

0到100倍的计算能力。Spark可以使用HDFS作为底层存储，使用户能够快速地从MapReduce切换到Spark计算平台上去。Spark提供一站式数据分析能力，包括小批量流式处理、离线批处理、SQL查询、数据挖掘等，用户可以在同一个应用中无缝结合使用这些能力。 Spark的特点如下：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
OPS03-05 进行混沌测试和演练 - 云架构中心

Engineering）是通过故障注入，验证故障快速恢复能力及系统可靠性的实践活动。风险等级高关键策略通过混沌工程的方法模拟可能出现的故障，进而综合验证系统在不同故障场景下的容错能力、监控能力、应急响应能力、定界定位、快速恢复等确定性恢复能力。验证高可用设计：业务系统在规划设计阶段进

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS03 完备的测试验证体系
RES14-02 自动化变更 - 云架构中心

境（计算、存储、网络、中间件服务等）、安装、配置，实现Infrastructure as a Code；以解决手工部署中易于出错、依赖个人能力，手工配置中变更无法跟踪、难以回滚等难题。风险等级高关键策略使用配置管理工具进行变更：集中管理配置信息，发现和记录配置变化情况，快速识别变更影响范围。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES14 配置防差错
RES13-06 压力负载测试 - 云架构中心

RES13-06 压力负载测试通过压力测试，可衡量系统的弹性扩容能力是否能满足业务要求。风险等级高关键策略参见“RES11-02 压力负载测试”章节。父主题： RES13 过载保护

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

据恢复ECS数据。详见“云备份概述”。故障自愈当ECS支持自动恢复时，可以开启自动恢复能力，当物理服务器损坏时以冷迁移方式重启ECS实例，使弹性云服务器具备高可靠性和强大的动态迁移能力。当弹性云服务器所在的硬件出现故障时，系统会自动将弹性云服务器迁移至正常的物理机，保障业务受

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ECS弹性云服务器
PERF03-02 选择合适规格的虚拟机和容器节点 - 云架构中心

服务器资源就类似一块块资源拼成的木桶，其最多能承载的业务需求取决于哪一块资源最先达到瓶颈。不同应用对资源需求不同，例如：功耗密集型业务（如高性能计算、人工智能、深度学习等场景）主要就是消耗计算维度的容量。内存密集型业务（如大数据处理、图像/视频处理、游戏开发、数据库等场景）主要消耗内存和存储维度的容量。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适的计算资源
概念表 - 云架构中心
概念表 - 云架构中心

而可靠性同样分为狭义可靠性与广义可靠性。狭义可靠性工程的目标是提高系统无故障运行的能力，即提高可靠性。而广义可靠性工程的目标除了提高可靠性外，还包括提高从故障中恢复运行能力，即维修性（maintainability），同时还包括其他围绕故障展开的各种能力，如可用性（availability）、保障性（supportability）等。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念
SEC04-02 控制网络流量的访问 - 云架构中心

需在网络级别验证所有的流量出入。确保网络设备的业务能力、网络每个部分的带宽满足业务高峰期的需要。风险等级高关键策略在设计网络拓扑时，仔细检查每个组件的连接要求，例如是否需要互联网可访问性（入站和出站）、连接到VPC的能力、边缘服务和外部数据中心等。除非资源必须接收来自公网

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC04 网络安全
OPS05-01 进行生产准备度评审（Product Readiness Review） - 云架构中心

、可过载控制、可故障管理、可变更能力、可运维、安全生产等维度，对服务可用性及运维能力提出基线要求。在服务产品开发前端构筑能力，进行相关需求规划、设计和开发工作，并在服务上线前进行生产准入审视。具备以下核心价值： 1）准确评价产品可用性、维护能力并明确相关上线标准；不满足上云标准的服务，原则上不允许上线。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS05 运维准备和变更管理
PERF02-02 容量规划 - 云架构中心

多种因素，包括市场趋势、消费者行为、竞争环境等。通过多种方法的组合，如历史数据分析、资源分析、趋势分析等，以此作为预测需求的基础，并结合人工智能机器学习算法，以便更准确地预测未来的需求，评估工作负载的资源需求。使预测与工作负载目标保持一致为了确保预测与工作负载目标保持一致，需

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF02 性能规划 > 性能规划
云运维中心(COC) - 云架构中心
云运维中心(COC) - 云架构中心

用户运维能力成熟度和云上运维效率。COC产品介绍：统一资源管理应用管理：提供应用和资源关联关系建模能力，满足用户云上资源的集中式管理要求，降低管理成本。资源管理：同步并纳管用户在云平台上使用的资源实例，构筑资源运维能力底座。配置管理：提供应用和资源视角的管理能力，以及参数配置集中式看护、全生命周期管理的能力。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
OPS06-03 制定和实施可观测性指标 - 云架构中心

、定级准确率、定界时长、覆盖率、有效率、一致率打造可观测能力，将可观测设计规范统一发布，统一设计要求与运维管理要求。设计建议整体技术方案会变成标准并进行发布，各个业务系统架构师在设计时遵循这套标准，这样可以保证能力能够从设计态开始，包括运行态、高可用架构等场景中得到应用。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系

总条数： 122

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

人工智能性能优化 - 云架构中心

RES12-05 应急恢复回溯 - 云架构中心

RES11-04 灾难演练 - 云架构中心

RES13-01 采用自动弹性扩缩容 - 云架构中心

云服务性能优化介绍 - 云架构中心

通过AOM助力系统运维能力提升，降低运维成本与难度 - 云架构中心

SEC10-04 安全事件演练 - 云架构中心

更多参考文档 - 云架构中心

Spark性能优化 - 云架构中心

OPS03-05 进行混沌测试和演练 - 云架构中心

RES14-02 自动化变更 - 云架构中心

RES13-06 压力负载测试 - 云架构中心

可靠性功能 - 云架构中心

PERF03-02 选择合适规格的虚拟机和容器节点 - 云架构中心

概念表 - 云架构中心

SEC04-02 控制网络流量的访问 - 云架构中心

OPS05-01 进行生产准备度评审（Product Readiness Review） - 云架构中心

PERF02-02 容量规划 - 云架构中心

云运维中心(COC) - 云架构中心

OPS06-03 制定和实施可观测性指标 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线