搜索_华为云

OPS06 可观测性体系 - 云架构中心

定义可观测对象 OPS06-03 制定和实施可观测性指标 OPS06-04 规范化应用日志 OPS06-05 实施依赖项遥测 OPS06-06 实施分布式跟踪 OPS06-07 通过可观测性指标引入自动化措施父主题：卓越运营支柱

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
OPS06-06 实施分布式跟踪 - 云架构中心

OPS06-06 实施分布式跟踪 Trace是一系列因果相关的分布式事件的表示，这些事件编码了流经分布式系统的端到端请求流。风险等级高关键策略当系统出现问题时，需要能够追踪系统中每个组件的行为和交互情况。通过在系统中实现分布式跟踪，可以快速定位问题并进行有效的故障排除。设计建议

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
DMS分布式消息服务 - 云架构中心

DMS分布式消息服务 DMS分布式消息服务支持以下各种消息类型： Kafka版：基于开源社区版Kafka提供的消息队列服务，向用户提供计算、存储和带宽资源独占式的Kafka专享实例。 RabbitMq版：完全兼容开源RabbitMQ，提供即开即用、消息特性丰富、灵活路由、高可用、

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍
DCS分布式缓存服务 - 云架构中心

DCS分布式缓存服务分布式缓存服务（Distributed Cache Service，简称DCS）是华为云提供的一款兼容Redis的高速内存数据处理引擎，可提供即开即用、安全可靠、弹性扩容、便捷管理的在线分布式缓存能力，满足用户高并发及数据快速访问的业务诉求。可靠性功能常见故障模式

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

CS实例支持定时和手动两种备份方式，定时备份频率以天为单位，最多保存7天，但至少会保留一个数据备份文件；手动备份由用户触发，通常在执行业务系统维护、升级等高危操作进行，保存期限无限制。 DCS指定备份集恢复。恢复过程中，实例会有一段时间不能处理客户端的数据操作请求，当前数据将被删除，待恢复完成后存储原有备份数据。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

ketMQ实例、实例节点、实例队列、实例消费组、实例队列消费组、实例的死信队列进行监控和告警。详见“支持的监控指标”。父主题： DMS分布式消息服务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DMS分布式消息服务
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

当多次重试后仍无法写入成功，可将数据写入本地缓存，待服务可用后再写入实例。当实例由于过载导致网络限制时，可参考“CPU /内存/带宽使用率过高”的处理。父主题： DMS分布式消息服务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DMS分布式消息服务
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

/内存/带宽/数据库连接数使用率过高”的处理。对于非暂行性故障，应用层需要能回退到原始数据源进行处理，避免由于缓存故障而导致业务无法运行。父主题： DCS分布式缓存服务

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
RES11 可靠性测试 - 云架构中心
RES11 可靠性测试 - 云架构中心

可靠性测试可靠性测试是为了保证系统在规定的生命周期内，达到预期的可靠性目标；与通常的功能测试不同，可靠性测试需要在业务负荷叠加故障中进行，对测试环境和能力提出了更高要求。可靠性测试和演练通过主动引入故障来充分验证软件质量的脆弱性，从而提前发现系统风险、提升测试质量、完善风险预案

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复
什么是应用韧性 - 云架构中心
什么是应用韧性 - 云架构中心

应用韧性是应用系统在运行过程中面对各种异常场景，如基础设施故障（如数据库异常）、外部攻击（如网络DDoS攻击超出预定限额流量）、外部依赖故障（如依赖系统访问超时或不可用）、地域灾难（如大面积停电、洪水）等，仍能提供和维持可接受的服务水平的能力，对系统至关重要。系统韧性设计主要涉及以下两个方面：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念
PERF04-05 应用性能数据采集 - 云架构中心

应用程序的性能数据（吞吐量、延迟和完成时间），通常需要通过代码采集，例如嵌入代码片段或将工具集成到应用程序代码中。通过应用的性能数据，可以识别性能瓶颈、评估系统行为、识别可用性风险、规划容量等指标。常用应用性能监控策略有： APM 工具：可用使用云上APM 工具或者开源的APM工具和分析性能数据（指标、日志、调研链）

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 性能数据采集
RES08-02 依赖松耦合 - 云架构中心

程度上屏蔽组件的状态变化，防止对其他组件造成影响相关云服务和工具弹性负载均衡服务 ELB 分布式缓存服务 DCS 分布式消息服务Kafka版分布式消息服务RabbitMQ版分布式消息服务RocketMQ版事件网格 EG 父主题： RES08 依赖减少与降级

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES08 依赖减少与降级
云服务可靠性介绍 - 云架构中心

云服务可靠性介绍概述 ECS弹性云服务器 BMS裸金属服务 CCE云容器引擎 ELB弹性负载均衡 AS弹性伸缩 DCS分布式缓存服务 DMS分布式消息服务 RDS云数据库云数据库 TaurusDB云数据库 OBS对象存储服务父主题：韧性支柱

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱
软件开发生产线(CodeArts） - 云架构中心

ps、精益看板等多种研发模式，还包含跨项目协同、基线与变更管理、自定义报表、Wiki在线协作、文档管理等功能。代码托管：基于Git提供分布式代码管理和协同开发能力，包括成员管理、权限控制、代码托管、代码检查、代码审核、代码追溯、持续集成等功能，助力不同规模企业的研发质量和效率提升。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 卓越运营云服务介绍
Spark性能优化 - 云架构中心
Spark性能优化 - 云架构中心

Spark的特点如下：通过分布式内存计算和DAG（无回路有向图）执行引擎提升数据处理能力，比MapReduce性能高10倍到100倍。提供多种语言开发接口（Scala/Java/Python），并且提供几十种高度抽象算子，可以很方便构建分布式的数据处理应用。结合SQL、S

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
PERF03-06 选择合适的消息队列 - 云架构中心

支持广播、事务消息、消息路由、死信队列、优先级队列等，适用于秒杀、流控、系统解耦等场景。详细版本对比可参考官方文档。相关云服务和工具：分布式消息服务Kafka版分布式消息服务RocketMQ版分布式消息服务RabbitMQ版父主题：选择合适的应用中间件云服务资源

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适的应用中间件云服务资源
HIVE优化 - 云架构中心
HIVE优化 - 云架构中心

Hive提供了Hadoop的SQL能力，主要参考标准的SQL，Hive进行了部分的修改，形成了自己的特有的SQL语法HQL（Hive SQL），更加适合于Hadoop的分布式体系，该SQL目前是Hadoop体系的事实标准。 Hive调优用户输入HQL，Hive将HQL进行词法解析，语法解析，之后生成执行计划，

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
PERF05-04 大数据场景资源优化 - 云架构中心

大数据场景资源优化风险等级中关键策略在大数据场景下，可以通过优化资源的使用和分配，提高系统的性能和效率。以下是一些常见的大数据场景资源优化方法：分布式存储：使用分布式存储系统，如Hadoop HDFS、Apache Cassandra等，将数据分散存储在多个节点上，以提高数据的可靠性和可扩展性。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF05 性能优化 > 资源优化
RES13-03 过载检测与流量控制 - 云架构中心

控制过程；典型过载控制方法定义如下：限流：在系统过载时主动丢弃部分业务请求。降级：在系统过载时提供有损服务，通过减少非核心业务，降低业务质量等措施降低系统负载。熔断：在分布式系统中，应用调用第三方资源和服务时由于第三方资源和服务故障（包括过载）而失败，停止调用远程资源和服务，避免故障扩散。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
RES07-01 定义关键指标与阈值并监控 - 云架构中心

务表现和系统状态，以便在异常状态下尽早干预恢复，或定位改进系统缺陷。风险等级中关键策略关键指标需要与系统内工作负载的关键性能指标相关，并能确定为系统性能下降的早期警告信号，如系统处理的API数量及成功率，相比CPU利用率、内存利用率等基础指标，能更真实的指示系统性能问题。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警

总条数： 205

上一页
1
2
3
4
5
...
11
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

OPS06 可观测性体系 - 云架构中心

OPS06-06 实施分布式跟踪 - 云架构中心

DMS分布式消息服务 - 云架构中心

DCS分布式缓存服务 - 云架构中心

可靠性功能 - 云架构中心

可靠性功能 - 云架构中心

常见故障模式 - 云架构中心

常见故障模式 - 云架构中心

RES11 可靠性测试 - 云架构中心

什么是应用韧性 - 云架构中心

PERF04-05 应用性能数据采集 - 云架构中心

RES08-02 依赖松耦合 - 云架构中心

云服务可靠性介绍 - 云架构中心

软件开发生产线(CodeArts） - 云架构中心

Spark性能优化 - 云架构中心

PERF03-06 选择合适的消息队列 - 云架构中心

HIVE优化 - 云架构中心

PERF05-04 大数据场景资源优化 - 云架构中心

RES13-03 过载检测与流量控制 - 云架构中心

RES07-01 定义关键指标与阈值并监控 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线