搜索_华为云

SEC02-04 一体化身份管理 - 云架构中心

统一身份管理系统与私有云、公有云平台的IAM系统进行身份联邦，统一身份管理系统中的用户身份可以同时访问私有云和公有云平台。统一身份管理系统与公司的HR流程结合，当员工入职、调岗和离职时可以触发用户的创建、变更和删除。针对Landing Zone搭建的云上多账号环境，利用IAM身份中心集中管理多个账号的用户

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC02 身份认证
OPS02-02 关联源代码版本和部署的应用版本，使用代码质量最佳实践 - 云架构中心

其次，在软件开发生命周期内，推动开发人员采用代码质量最佳实践，例如，使用代码审查或结对编程等最佳实践来提高代码质量，确保每行代码在合入代码仓时，都有两个以上的工程师审查过，同时，通过设置代码合入策略进行代码控制，确保代码审查规范的执行。最后，建议通过自动化代码检查策略进行代码问题检查。相关云服务和工具

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS02 通过CI/CD实现高效的频繁可逆的小规模变更
RES15-03 自动化回滚 - 云架构中心

自动化回滚在升级或部署过程中出现异常，或检查/测试失败时，支持自动回滚，减少人工干预，避免回滚失败。风险等级高关键策略检测到异常后，可一键式回滚。回滚过程自动化完成。父主题： RES15 升级不中断业务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES15 升级不中断业务
RES14-04 提供runbook进行标准化变更 - 云架构中心

格按照runbook执行，在变更失败时根据runbook进行回退。风险等级高关键策略 runbook需涵盖变更前检查、变更操作、变更后检查及变更失败回退操作。父主题： RES14 配置防差错

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES14 配置防差错
人工智能性能优化 - 云架构中心

size、重计算策略等参数。尽可能充分利用显存和算力，通过参数调优，初步优化性能。性能拆解参数调优后性能仍然与转商目标有较大的差距，需要考虑进行profiling，采集性能数据后从更底层的算子、通信、调度和内存等维度将性能进行拆解分析，训练脚本中加入profiling代码。具体

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
OPS08-02 进行事故复盘和改进 - 云架构中心

OPS08-02 进行事故复盘和改进事故分析的目的是：规范和指导重大事故发生后，优化事故的输入、输出，确保事故回溯工作有效开展，回溯报告中发现的问题有效整改，总结的经验有效推广。风险等级高关键策略故障发生后，通过对现网重大故障处理过程 Review 及根因进行分析和改进总结，规

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS08 度量运营状态和持续改进
RTO与RPO - 云架构中心
RTO与RPO - 云架构中心

RTO与RPO 灾难场景通常采用RTO和RPO目标定义：恢复时间目标RTO：指灾难发生后应用不可用的最长时间。RTO决定了应用容灾整体架构，是采用数据备份，还是冷备、温备、热备。恢复点目标RPO：指灾难发生后应用数据丢失的最大时间。RPO决定了数据备份频率或复制方式，是在线备份还是离线备份，是同步复制还是异步复制。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念 > 可用性目标定义
COST04-02 主动监控成本 - 云架构中心

COST04-02 主动监控成本风险等级中关键策略不要只在出账后或收到异常通知时再查看成本和用量，应使用工具定期检查成本。定期监控和主动分析成本，有助于您及时识别成本趋势，避免异常发生。相关服务和工具创建预算提醒，将预算设置为提醒阈值，在预测或实际成本超出预算时，及时获取超预算通知，防止潜在成本超支。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST04 持续进行成本治理
RES15-02 自动化检查 - 云架构中心

与。风险等级高关键策略在部署或升级过程中集成基本测试功能，在部署或升级完成后自动进行检查和测试，以验证新部署的代码功能是否正确。在部署或升级过程中集成故障注入测试功能，在部署或升级完成后自动注入故障进行测试，以验证新部署代码的韧性。父主题： RES15 升级不中断业务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES15 升级不中断业务
RES12-03 定期应急恢复演练 - 云架构中心

定期应急恢复演练定期测试突发事件应急恢复处理，以便在出现问题后能进行高效的恢复处理。风险等级高关键策略每年至少进行一次应急恢复演练；通过演练可提升操作人员的熟练程度。演练期间严格按照应急预案进行恢复，以检验应急预案的准确性。演练结束后需要对恢复过程进行回溯，并优化应急预案。相关云服务和工具

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

过节点冗余方式实现实例容灾，当检测到主节点故障后，快速切换到备节点并自动恢复，在异常检测和恢复期间，可能会影响业务，时间在半分钟内。数据备份和恢复 DCS支持将当前时间点的实例缓存数据备份并存储到OBS中，以便在缓存实例发生异常后能够从备份数据进行恢复。DCS实例支持定时和手动

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

ELB弹性负载均衡支持定期向后端服务器发送请求以测试其运行状态。当判断后端服务器健康检查异常后，就不会将流量分发到异常后端服务器，而是分发到健康检查正常的后端服务器，从而提高了业务的可靠性。当异常的后端服务器恢复正常运行后，负载均衡器会将其自动恢复到负载均衡服务中，承载业务流量。详见“健康检查介绍”。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ELB弹性负载均衡
OPS04-04 自动化工程运维任务 - 云架构中心

程的效率。在高环境下自动批准可能存在风险。密切关注并测试您的自动批准，以确保定义特定标准来授予批准。新用户和新员工入职：您可以自动执行与新应用程序用户或新员工入职相关的许多任务，例如数据库更新和凭据创建。相关云服务和工具资源编排服务 RFS CodeArts Pipeline

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS04 自动化构建和部署流程
COST05-02 建立可以量化的优化目标 - 云架构中心

的过程中，您不只是提升了资源利用率，同时也可以是提升了业务开发，部署的速度，从而提升了业务对市场的响应时间，以及人员的效率。这部分也应该列入量化的内容。最后，优化的目标是使企业或者组织每一块钱的花费都能产生最大的效益。不能只专注于降低成本而忽略业务价值。设定一个明确的可量化的优

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST05 优化指定策略和目标
RES12-05 应急恢复回溯 - 云架构中心

RES12-05 应急恢复回溯在业务进行应急恢复处理后，需要对事件进行回溯并进行优化，以避免故障的再次发生。风险等级高关键策略对问题进行定位和修复，优化产品能力，减少同类事件的发生。针对应急恢复过程进行总结，优化恢复过程。父主题： RES12 应急恢复处理

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
RES06-02 面向所有故障进行检测 - 云架构中心

服务、方法、实例或容器ID等，检测维度与故障恢复方式对齐。检测到故障后需及时告警或自动恢复。针对具体故障进行检测时，根据检测的类型通常可以分为资源检测、功能检测和业务检测。资源检测：云环境中一般指虚拟化后的物理硬件资源及其对应的软件资源，具体包含CPU、内存、网络和磁盘资源等。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES06 故障检测
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

可靠性功能集群HA Kafka实例通过副本冗余方式实现实例容灾，当检测到leader副本故障后，快速完成副本选主，保障Kafka实例持续提供服务。 RabbitMQ集群提供镜像队列，通过镜像在其他节点同步数据。单节点宕机时，仍可通过唯一的访问地址对外提供服务。 RocketMQ

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DMS分布式消息服务
RES12-01 组建应急恢复团队 - 云架构中心

并进行培训。风险等级高关键策略组建应急恢复团队：其中包括应急恢复主席及所有组件及关键依赖项的恢复责任人。应急恢复主席：在出现问题后及时组织应急恢复团队进行快速恢复处理。组件或关键依赖项运维责任人：负责问题定位和应急恢复处理。制定应急恢复管理方案：所有应急恢复团队人员

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
RES12-02 制定应急预案 - 云架构中心

RES12-02 制定应急预案针对常见问题现象，提供标准化的应急恢复指导，以便在出现问题后，可以有序的完成恢复操作，避免操作失误。风险等级高关键策略需要覆盖常用典型场景。应急恢复需要有标准的操作流程和动作，确保在事件发生时，相关干系人都能够明确自身职责和所需要采取的措施。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
RabbitMQ性能优化 - 云架构中心
RabbitMQ性能优化 - 云架构中心

会把消息转存到磁盘，转存过程会耗费大量时间，造成消息处理速度下降或直接阻塞生产流程。因此队列中堆积过多的消息容易对 broker 产生负面效应。除此之外，如果节点崩溃后重启，过多的数据会使得重建索引需要消耗大量时间，集群模式下的节点间同步数据也会非常耗时。使用惰性队列提升稳定性惰性队列（lazy queues）是

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 消息队列性能优化

总条数： 193

上一页
1
...
6
7
8
9
10
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

SEC02-04 一体化身份管理 - 云架构中心

OPS02-02 关联源代码版本和部署的应用版本，使用代码质量最佳实践 - 云架构中心

RES15-03 自动化回滚 - 云架构中心

RES14-04 提供runbook进行标准化变更 - 云架构中心

人工智能性能优化 - 云架构中心

OPS08-02 进行事故复盘和改进 - 云架构中心

RTO与RPO - 云架构中心

COST04-02 主动监控成本 - 云架构中心

RES15-02 自动化检查 - 云架构中心

RES12-03 定期应急恢复演练 - 云架构中心

可靠性功能 - 云架构中心

可靠性功能 - 云架构中心

OPS04-04 自动化工程运维任务 - 云架构中心

COST05-02 建立可以量化的优化目标 - 云架构中心

RES12-05 应急恢复回溯 - 云架构中心

RES06-02 面向所有故障进行检测 - 云架构中心

可靠性功能 - 云架构中心

RES12-01 组建应急恢复团队 - 云架构中心

RES12-02 制定应急预案 - 云架构中心

RabbitMQ性能优化 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线