检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
裸金属服务器Euler OS升级NetworkManager-config-server导致SSH链接故障解决方案 问题现象 裸金属服务器EulerOS 2.8系统下,使用yum update -y命令,导致软件NetworkManagre-config-server升级到高版本,
通用(精炼)生产方案向导 您可以参考向导制定一个通用的生产方案。 前提条件 已登录MBM Space,且拥有该菜单栏目的操作权限。 操作步骤 在顶部导航栏中,选择“制造数据模型管理 > 从这里开始 > 通用(精炼)生产方案向导”。 进入“通用(精炼)生产方案向导”页面。 图1 通用生产方案向导
查看微服务版本信息 本文介绍如何查看及删除微服务版本信息。 查看微服务版本信息 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“微服务开发 > 服务发现”。 选择左侧导航栏的“服务目录 > 一方服务”。 选择“微服务列表”页签,单击微服务列表中的微服务名。 选择左侧导航栏的
在WiseDBA中执行SQL查询及表结构查询 WiseDBA数据查询功能可以帮助业务简化现网的SQL查询流程,避免SRE直接操作数据库。 前提条件 需要具备AppStage服务运维岗位权限、服务研发岗位权限、运维管理员权限或基础运维岗位权限,权限申请操作请参见AppStage组织成员申请权限
Schema及Keyspace概念介绍 在MySQL类数据库中,Database是数据库对象的物理集合,不同的Database之间资源是完全隔离的(除部分共享对象之外)。每个Database都是一个独立的命名空间,用于存储和管理相关的数据库对象,如表、视图、函数等。Schema与Database
部署灰度版本组件到灰度泳道 灰度泳道创建后,根据实际业务需要创建灰度版本组件,用于调整流量至灰度泳道验证业务。 此处需要分别创建并部署2个灰度版本组件:unit-controller-gray和unit-provider-gray。 操作步骤 登录ServiceStage控制台。
查看监控服务已开发的业务报表 服务所有人员可以在“业务报表”页面查看已配置的业务报表,通过业务报表对业务进行监控。 查看业务报表 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。 选择左侧导航栏的“监控 >
为隔离域关联ACL 网络ACL是一个子网级别的可选安全层,通过与子网关联的出方向/入方向规则控制出入子网的网络流量。ENS支持为已创建的虚拟机类型资源的隔离域关联ACL,本章节介绍如何为隔离域关联ACL。 前提条件 已获取服务运维岗位权限、基础运维岗位权限或运维管理员权限,权限申请操作请参见申请权限
获取所有支持的应用组件运行时类型 功能介绍 此API用来获取所有支持应用组件运行时类型。 调试 您可以在API Explorer中调试该接口。 URI GET /v2/{project_id}/cas/metadata/runtimes 表1 路径参数 参数 是否必选 参数类型 描述
根据泳道组ID修改泳道组网关路由配置 功能介绍 此API用于根据泳道组ID修改泳道组网关路由配置。 URI PUT /v3/{project_id}/cas/swimlane-group/{lane_group_id}/route 表1 路径参数 参数 是否必选 参数类型 描述 project_id
修改AstroZero预置Portal User Profile权限的访问范围 业务用户权限不能满足需求时,可按照本章节操作为业务用户赋予新的权限。 操作场景 在AstroZero中新添加的业务用户,若没有配置指定的权限,默认使用系统预置的Portal User Profile权限
如何处理启动一个新服务后导致一个节点内存使用率过高的问题? 问题描述 启动一个新服务导致一个节点内存使用率过高,怎么处理? 解决方法 设置调度策略亲和性,可以使服务实例按亲和性节点部署即可。 父主题: 应用运维
训练场景和方案介绍 Stable Diffusion(简称SD)是一种基于扩散过程的图像生成模型,应用于文生图场景,能够帮助用户生成图像。 方案概览 本方案介绍了在ModelArts Lite DevServer上使用昇腾计算资源Ascend Snt9B开展SDXL和SD1.5模型的训练过程
非分离部署推理服务 本章节介绍如何使用vLLM 0.5.0框架部署并启动推理服务。 什么是非分离部署 全量推理和增量推理在同一节点上进行。 前提条件 已准备好DevServer环境,具体参考资源规格要求。推荐使用“西南-贵阳一”Region上的DevServer和昇腾Snt9b资源
使用AWQ量化工具转换权重 AWQ(W4A16/W8A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见支持的模型列表和权重文件。 本章节介绍如何在Notebook使用AWQ量化工具实现推理量化。 量化方法:W4A16
使用SmoothQuant量化工具转换权重 SmoothQuant(W8A8)量化方案能降低模型显存以及需要部署的卡数。也能同时降低首token时延和增量推理时延。支持SmoothQuant(W8A8)量化的模型列表请参见支持的模型列表和权重文件。 本章节介绍如何在Notebook
使用kv-cache-int8量化 kv-cache-int8是实验特性,在部分场景下性能可能会劣于非量化。当前支持per-tensor静态量化,支持kv-cache-int8量化和FP16、BF16、AWQ、smoothquant的组合。 kv-cache-int8量化支持的模型请参见支持的模型列表和权重文件
常见错误原因和解决方法 显存溢出错误 网卡名称错误 父主题: 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导(6.3.908)
SFT全参微调训练任务 步骤一 上传训练权重文件和数据集 如果在准备代码和数据阶段已经上传权重文件和数据集到容器中,可以忽略此步骤。 如果未上传训练权重文件和数据集到容器中,具体参考上传代码和权重文件到工作环境和上传数据到指定目录章节完成。训练脚本中会自动执行训练前的权重转换操作和数据处理操作
训练的权重转换说明 以llama2-13b举例,使用训练作业运行obs_pipeline.sh脚本后,脚本自动执行权重转换,并检查是否已经完成权重转换的过程。 如果已完成权重转换,则直接执行训练任务。如果未进行权重转换,则会自动执行scripts/llama2/2_convert_mg_hf.sh