搜索_华为云

准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

中创建文件夹model/llama-2-13b-hf。利用OBS Browser+工具将下载的模型文件上传至创建的文件夹目录下。在ECS服务器中安装obsutil工具，具体命令可参考obsutil工具快速使用，将OBS桶中的数据下载至SFS Turbo中。注意：需要使用用户账

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

-aux查到的进程号，使用kill -9强制关闭进程。 sudo kill -9 <进程ID> 方法2：如果方法1执行后无法消除D+进程，请尝试重启服务器。父主题： Lite Server

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
查看诊断报告 - AI开发平台ModelArts

confusion_transpose, 梯度裁剪和亲和优化器等多个可替换的API，用户可根据代码堆栈找到需要替换的具体源码，然后根据API instruction跳转后的参考文档修改源代码，从而使能亲和API提升训练性能。注意这里提示的亲和API并非都能提升训练性能，需要用户替换后实测，由于有

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
ModelArts支持使用ECS创建专属资源池吗？ - AI开发平台ModelArts

ModelArts支持使用ECS创建专属资源池吗？不支持。创建资源池时，只能选择界面提供的“未售罄”节点规格进行创建。专属资源池的节点规格后台是对应的ECS资源，但是无法使用账号下购买的ECS，作为ModelArts专属资源池。父主题： Standard专属资源池

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard专属资源池
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

中创建文件夹model/llama-2-13b-hf。利用OBS Browser+工具将下载的模型文件上传至创建的文件夹目录下。在ECS服务器中安装obsutil工具，具体命令可参考obsutil工具快速使用，将OBS桶中的数据下载至SFS Turbo中。注意：需要使用用户账

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
什么是ModelArts - AI开发平台ModelArts

箱即用，对预置大模型进行二次开发，用于生产商用。 ModelArts Lite-Server 面向云主机资源型用户，基于裸金属服务器进行封装，可以通过弹性公网IP直接访问操作服务器。适用于已经自建AI开发平台，仅有算力需求的用户，提供高性价比的AI算力，并预装主流AI开发套件以及自研的加速插件。

帮助中心 > AI开发平台ModelArts > 产品介绍
pipeline代码适配 - AI开发平台ModelArts

/home_host/work/pipeline cd /home_host/work/pipeline 将onnx pipeline依赖的图生图源码“pipeline_onnx_stable_diffusion_img2img.py”复制到该目录下，名称改为“pipeline_onnx

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 应用迁移
LLaVA模型基于Lite Server适配PyTorch NPU预训练指导（6.3.912） - AI开发平台ModelArts

json文件，并放于${container_work_dir}/LLaVA/playground/data/LLaVA-Pretrain目录下。步骤五：开始训练进入解压后的源码包根目录。 cd ${container_work_dir}/LLaVA 修改训练脚本模型路径(--model_name_or_path 模型路径)。

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
VS Code连接后长时间未操作，连接自动断开 - AI开发平台ModelArts

比如防火墙配置是2小时空闲就关闭连接，那客户端配置ServerAliveInterval小于2小时（比如1小时），就可以避免防火墙将连接断开。服务器端配置（Notebook当前已经配置，24h应该是长于防火墙的断连时间配置，该配置无需用户手工修改，写在这里仅是帮助理解ssh配置原理）配

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
IAM - AI开发平台ModelArts
IAM - AI开发平台ModelArts

Administrator 裸金属服务器BMS BMS FullAccess 镜像服务IMS IMS FullAccess 数据加密服务DEW DEW KeypairReadOnlyAccess 虚拟私有云VPC VPC FullAccess 弹性云服务器ECS ECS FullAccess

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
ModelArts - AI开发平台ModelArts
ModelArts - AI开发平台ModelArts

ModelArts训练好后的模型如何获取？如何查看训练作业的资源占用情况？更多 Lite Server 哪里可以了解Atlas800训练服务器硬件相关内容 GPU A系列裸金属服务器如何更换NVIDIA和CUDA？更多开发环境在ModelArts的Notebook中使用不同的资源规格训练时为什么训练速度差不多？

帮助中心 > AI开发平台ModelArts > 成长地图
如何减小本地或ECS构建镜像的目的镜像的大小？ - AI开发平台ModelArts

如何减小本地或ECS构建镜像的目的镜像的大小？减小目的镜像大小的最直接的办法就是选择尽可能小且符合自己诉求的镜像，比如您需要制作一个PyTorch2.1+Cuda12.2的镜像，官方如果没有提供对应的PyTorch或者Cuda版本的镜像，优选一个没有PyTorch环境或没有安装

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard镜像相关
JupyterLab常用功能介绍 - AI开发平台ModelArts

表示代码运行状态，变为实心圆时，表示代码在运行中。分享到AI Gallery。代码化参数插件的使用代码参数化插件可以降低Notebook案例的复杂度，用户无需感知复杂的源码，按需调整参数快速进行案例复现、模型训练等。该插件可用于定制Notebook案例，适用于比赛、教学等场景。仅对Code cell类型新增了Edit

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
SDXL基于Standard适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

Step6 准备镜像创建ECS。参考ECS文档购买弹性云服务器。网络配置、高级配置等后续步骤，可根据默认选择，或进行自定义。创建完成后，单击“远程登录”，并在控制台发送后续步骤中的远程命令。注意：创建的ECS虚拟机使用ARM镜像创建。图1 购买ECS 安装Docker。检查docker是否安装。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
LLaVA模型基于DevServer适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

6f17d12dbd/LLaVA/playground/data/eval目录下。图2 MME评估集 Step6 开始推理进入解压后的源码包根目录。 cd ${container_work_dir}/multimodal_algorithm/LLAVA/llava-infer

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
线下容器镜像构建及调试 - AI开发平台ModelArts

install等方式安装conda环境的依赖。更多ModelArts自定义镜像介绍请见自定义镜像简介。调试要点确认对应的脚本、代码、流程在linux服务器上运行正常。如果在linux服务器上运行就有问题，那么先调通以后再做容器镜像。确认打入镜像的文件是否在正确的位置、是否有正确的权限。训练场景主要查看自研的依赖包是否正常，查看pip

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
SDXL基于Standard适配PyTorch NPU的LoRA训练指导（6.3.908） - AI开发平台ModelArts

Step6 准备镜像创建ECS。参考ECS文档购买弹性云服务器。网络配置、高级配置等后续步骤，可根据默认选择，或进行自定义。创建完成后，单击“远程登录”，并在控制台发送后续步骤中的远程命令。注意：创建的ECS虚拟机使用ARM镜像创建。图1 购买ECS 安装Docker。检查docker是否安装。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
MoXing进阶用法的样例代码 - AI开发平台ModelArts

key='df', mode='w') pd.read_hdf('obs://wolfros-net/hdftest.h5') 通过重写pandas源码API的方式，将该API改造成支持OBS路径的形式。写h5到OBS = 写h5到本地缓存 + 上传本地缓存到OBS + 删除本地缓存从OBS读h5

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 在Notebook中使用Moxing命令
使用ModelArts Studio的Qwen2-7B模型框架实现对话问答 - AI开发平台ModelArts

专属资源池需单独创建，不与其他租户共享。公共资源池实例规格选择实例规格，规格中描述了服务器类型、型号等信息。 xxx 流量限制（QPS）设置待部署模型的流量限制QPS。 3 实例数设置服务器个数。 1 更多选项内容审核选择是否打开内容审核，默认启用。开关打开（默认打开）

帮助中心 > AI开发平台ModelArts > 快速入门
在ECS中创建ma-user和ma-group - AI开发平台ModelArts

在ECS中创建ma-user和ma-group 在ModelArts训练平台使用的自定义镜像时，默认用户为ma-user、默认用户组为ma-group。如果在训练时调用ECS中的文件，需要修改文件权限改为ma-user可读，否则会出现Permission denied错误，因此需

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置

总条数： 445

上一页
1
...
11
12
13
...
23
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备权重 - AI开发平台ModelArts

训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

查看诊断报告 - AI开发平台ModelArts

ModelArts支持使用ECS创建专属资源池吗？ - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

什么是ModelArts - AI开发平台ModelArts

pipeline代码适配 - AI开发平台ModelArts

LLaVA模型基于Lite Server适配PyTorch NPU预训练指导（6.3.912） - AI开发平台ModelArts

VS Code连接后长时间未操作，连接自动断开 - AI开发平台ModelArts

IAM - AI开发平台ModelArts

ModelArts - AI开发平台ModelArts

如何减小本地或ECS构建镜像的目的镜像的大小？ - AI开发平台ModelArts

JupyterLab常用功能介绍 - AI开发平台ModelArts

SDXL基于Standard适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

LLaVA模型基于DevServer适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

线下容器镜像构建及调试 - AI开发平台ModelArts

SDXL基于Standard适配PyTorch NPU的LoRA训练指导（6.3.908） - AI开发平台ModelArts

MoXing进阶用法的样例代码 - AI开发平台ModelArts

使用ModelArts Studio的Qwen2-7B模型框架实现对话问答 - AI开发平台ModelArts

在ECS中创建ma-user和ma-group - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线