检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
处理运维中心变更电子流 变更电子流提交后会走给审批人处理,设置的各级审批人审批变更方案的合理性后,会走给变更实施人做变更实施,变更实施人处理后,会走给变更验证人验证变更是否成功。 处理变更电子流 进入AppStage运维中心。 将鼠标悬停在右上角的账号,选择下拉列表中的“工单管理”,默认显示“变更单管理”页面。
创建运维中心事件单 本章节介绍如何创建事件单。 创建事件单 进入AppStage运维中心。 将鼠标悬停在右上角的账号,选择下拉列表中的“工单管理”,默认显示“变更单管理”页面。 单击左侧导航栏的“事件单管理”,进入“事件单管理”页面。 单击“新建”。 配置事件单参数,参数说明如表1所示。
处理运维中心事件单 对于已创建的事件单或使用告警信息直接生成事件单进行处理,可以对事件单进行标记、移交、暂停、退回和关闭处理,事件单不同处理方式说明如事件单处理说明所示。 处理事件单 进入AppStage运维中心。 将鼠标悬停在右上角的账号,选择下拉列表中的“工单管理”,默认显示“变更单管理”页面。
查看主机监控报表 如果在监控服务配置采集主机监控指标数据,会生成主机监控报表,可以从主机列表跳转查看主机监控报表。采集主机监控指标数据的操作请参见监控服务采集Linux主机监控指标操作流程。 查看主机监控报表 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维
在VMS回收云硬盘 在VMS页面可以回收云硬盘,服务运维岗位权限人员申请回收磁盘,申请回收后的磁盘会自动放入回收站中,基础运维岗位人员可以在回收站中立即回收,运维管理员可以申请回收主机同时可以在回收站立即回收主机。 前提条件 已获取服务运维岗位权限、基础运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。
部署服务环境管理 对部署资源的配置漂移进行修复 基于当前状态的资源配置导出IaC3.0包 在部署服务释放环境 父主题: 使用部署服务进行自动化变更
在部署服务变更组件 组件是具有相同资源的集合,使用组件对资源进行统一管理。部署服务支持单独变更在IaC Patch包(软件仓库中IaC 3.0包的iacpatch包类型)中定义的组件资源,IaC Patch包目录结构如IaC Patch包典型目录结构所示。 前提条件 已获取服务运
AppStage软件仓库全局管理 软件仓库包类型介绍 手动上传各类包到AppStage软件仓库 管理开发中心推送的镜像包 录入并绑定华为云镜像仓SWR 父主题: 使用部署服务进行自动化变更
查看注册到Cloud Map的中间件 中间件是指业务服务实现自身功能需要用到的技术组件,随业务服务独立部署和运维。 中间件统一展示在中间件列表中,中间件列表只提供数据的查询和展示,不提供对数据的增、删、改操作。所有的增删改操作都在各中间件的管理台上操作,中间件管理台上的操作,会自动同步到Cloud
在SLB中创建和管理流控服务 在SLB中创建OLC服务 配置负载均衡OLC服务 发布负载均衡OLC服务 导出OLC规则的IAC信息 父主题: 配置运维中心负载均衡
了解代码结构 OrgID登录功能Demo的代码结构如图1所示。 图1 代码结构 deploy_docker为docker部署配置信息。 ├─deploy_docker │ ├─bin │ │ configparser
将用户添加团队成员后,用户就能进入团队进行操作吗? 项目经理在“团队成员”页面将用户添加为团队成员后,该用户还需要在开发中心首页“我的团队”中关注该团队,以关注“TestTeam”为例,如图1所示,关注团队后,该用户才可进一步在此团队以具备的角色权限进行相应操作。 图1 关注团队
watchdog still running 问题现象 SLB部署失败,日志详细信息提示如下: "watchdog still running" 排查定位 登录SLB实例主机,并执行命令ps -ef | grep watchdog,查看watchdog进程是否是root用户拉起的。
左侧菜单栏不显示“堡垒机”怎么办? 问题描述 主机管理服务VMS左侧菜单栏不显示“堡垒机”。 处理方法 确认是否已获取基础运维角色权限或所选自有服务的服务运维岗位权限,权限申请操作请参见申请权限。 已获取权限后未显示“堡垒机”,可联系AppStage运维中心人员处理(在管理面设置堡垒机类型为“CBH”)。
too much null size 问题现象 动态阈值告警任务,judge历史的原始详情中出现too much null size报错。 可能原因 告警原始表中存在大量空值或者表无数据。 解决方法 在MPPDB汇聚中新建任务,查询告警原始表中数据是否正常。 检查汇聚任务及上游数
给子账号配置部署上线基本使用权限 场景描述 本文介绍部署上线场景下子账号所需的基本使用权限,您可参考权限清单新增对应业务场景的权限。示例场景为授权子账号权限,使其能够在开发环境Notebook中使用基础镜像构建一个新的推理镜像,并完成模型的创建,部署为在线服务。 权限清单 权限 表1
基于LLM模型的GPU训练业务迁移至昇腾指导 场景介绍 环境准备 迁移适配 精度对齐 性能调优 常见问题 父主题: GPU业务迁移至昇腾训练推理
模型适配 基于MindSpore Lite的模型转换 动态shape 父主题: GPU推理业务迁移至昇腾的通用指导
主流开源大模型基于Standard适配PyTorch NPU训练指导(6.3.906) 场景介绍 准备工作 预训练 SFT全参微调训练 LoRA微调训练 开启训练故障自动重启功能 查看日志和性能 训练脚本说明 父主题: LLM大语言模型训练推理
配置Lite Cluster网络 本章节介绍如何申请弹性公网IP并绑定到弹性云服务器。通过本文档,您可以实现弹性云服务器访问公网的目的。 使用华为云账号登录CCE管理控制台。 找到购买Cluster资源时选择的CCE集群,单击名称进入CCE集群详情页面,单击“节点管理”页签,在“