检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
预训练 前提条件 已上传训练代码、训练权重文件和数据集到SFS Turbo中,具体参考代码上传至OBS和使用Notebook将OBS数据导入SFS Turbo。 Step1 在Notebook中修改训练超参配置 以llama2-13b预训练为例,执行脚本0_pl_pretrain_13b
Open-Clip基于DevServer适配PyTorch NPU训练指导 Open-Clip广泛应用于AIGC和多模态视频编码器的训练。 方案概览 本方案介绍了在ModelArts的DevServer上使用昇腾NPU计算资源开展Open-clip训练的详细过程。完成本方案的部署
主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导(6.3.910) 场景介绍 准备工作 预训练 SFT全参微调训练 LoRA微调训练 查看日志和性能 训练脚本说明 常见错误原因和解决方法 父主题: LLM大语言模型训练推理
主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导(6.3.909) 场景介绍 准备工作 预训练 SFT全参微调训练 LoRA微调训练 查看日志和性能 训练脚本说明 常见错误原因和解决方法 父主题: LLM大语言模型训练推理
使用插件模板为容器集群安装插件 ERS提供通过插件模板为集群安装插件的功能,本章节介绍如何为集群安装插件。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 为集群安装插件 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 >
订阅BaaS服务已共享指标 服务想要获取BaaS服务的横向数据,比如说音乐或视频业务想实时查看SLB、ELB的指标监控,可以通过指标共享的方式获取指标,支持按照标签或指标级进行共享。 BaaS服务数据开发人员创建并共享指标后,服务运维和开发人员在标签查询中可以按标签查询指标的定义,服务无指标编辑权限。
按标签名称删除标签及仅包含此标签的文件 功能介绍 按标签名称删除标签及仅包含此标签的文件。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI DELETE /v2/{p
使用预置AI算法部署在线服务报错gunicorn:error:unrecorgized arguments 问题现象 使用预置AI算法部署在线服务报错gunicorn:error:unrecorgized arguments... 图1 在线服务报错 原因分析 根据报错日志分析,
GPU A系列裸金属服务器RoCE带宽不足如何解决? 问题现象 GP Ant8支持RoCE网卡, Ubuntu20.04场景,在进行nccl-tests时,总线带宽理论峰值可达90GB/s,但实际测试下来的结果只有35GB/s。 原因分析 “nv_peer_mem”是一个Linu
上传数据和算法至OBS(首次使用时需要) 前提条件 已经在OBS上创建好并行文件系统,请参见创建并行文件系统。 已经在obsutil安装和配置,请参见obsutils安装和配置。 准备数据 单击下载动物数据集至本地,并解压。 通过obsutil将数据集上传至OBS桶中。 ./obsutil
创建训练任务 调试代码 创建训练任务之前,建议先调试代码。 由于Notebook的/cache目录只能支持500G的存储,超过后会导致实例重启,ImageNet数据集大小超过该限制,因此建议用线下资源调试、或用小批量数据集在Notebook调试(Notebook调试方法与使用No
FLUX.1基于DevServer适配PyTorch NPU推理指导(6.3.909) Flux是一种基于扩散过程的图像生成模型,应用于文生图场景,能够帮助用户生成图像。官方提供了三个版本:FLUX.1-pro、FLUX.1-dev和FLUX.1-schnell。 方案概览 本方案介绍了在ModelArts
Qwen-VL基于DevServer适配Pytorch NPU的推理指导(6.3.909) Qwen-VL是规模视觉语言模型,可以以图像、文本、检测框作为输入,并以文本和检测框作为输出。具有强大的性能、多语言对话、多图交错对话、支持中文开放域定位、细粒度识别和理解等特点。 本文档
创建新版Notebook无法使用已购买的专属资源池,如何解决? 问题现象 已购买专属资源池,但创建Notebook时该资源池不可选择,无法创建Notebook。 提示当前专属资源池未初始化开发环境,请到专属资源池页面初始化开发环境。 原因分析 新购买的专属资源池,需要初始化环境才能用于创建Notebook。
查看灰度泳道组件克隆历史 本章节指导您查看灰度泳道组件的克隆日志。 前提条件 待操作灰度泳道已执行过组件克隆操作,请参考克隆基线泳道组件到灰度泳道。 查看灰度泳道组件克隆历史 登录ServiceStage控制台。 单击“全链路流量控制”。 单击待操作灰度泳道所在泳道组名称,进入“全链路流量控制”页面。
管理开发中心版本活动 添加自定义版本活动 修改系统预置版本活动关联的工具链 添加版本交付件模板 添加版本代码安全检视检查项 管理版本标准发布准入配置 父主题: 管理AppStage开发中心系统配置
管理开发中心系统菜单 AppStage开发中心提供菜单管理,可以修改系统菜单关联的工具链或对系统菜单进行上线下线操作,也可以添加菜单并为菜单关联在“工具链集成配置”页面已集成的页面。 前提条件 已获取组织管理员角色权限,权限申请方法请参见申请权限。 管理系统菜单 在开发中心首页右上角选择“工具链
自定义Topic IEF支持自定义Topic,Topic根据您的需要自行定义。 您可以将终端设备数据发送到边缘节点MQTT broker的自定义Topic中,IEF会将这些数据转发到DIS通道或APIG后端地址。数据转发到DIS通道或者APIG后端地址后,您可以提取这些数据,并对数据进行处理分析。
Lite Server资源配置流程 在开通Lite Server资源后,需要完成相关配置才能使用,配置流程如下图所示。 图1 Lite Server资源配置流程图 表1 Server资源配置流程 配置顺序 配置任务 场景说明 1 配置Lite Server网络 Server资源开
配置任务基本信息 概述 通过在ROMA Connect中创建数据集成任务,您可以实现不同数据源之间的数据集成转换。ROMA Connect根据您在数据集成任务中的配置,决定如何将指定的源端的一个数据表中的数据集成到目标端的一个数据表中。 数据集成任务的配置分为任务基本信息、制定计