搜索_华为云

准备Notebook - AI开发平台ModelArts

您可以在Notebook中导入完代码之后，在Notebook运行sh scripts/install.sh命令提前下载完整代码包和安装依赖包，然后使用保存镜像功能。后续训练作业使用新保存的镜像，无需每次启动训练作业时再次下载代码包以及安装依赖包，可节约训练作业启动时间。由于训练启动命令也会执行sh

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 准备工作
服务部署、启动、升级和修改时，资源不足如何处理？ - AI开发平台ModelArts

专属资源池扩容，可参考扩缩容资源池。如果磁盘空间不够，可以尝试重试，使实例调度到其他节点。如果单实例仍磁盘空间不足，请联系系统管理员，更换合适的规格。如果是大模型导入的模型部署服务，请确保专属资源池磁盘空间大于1T（1000GB）。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
GP Vnt1裸金属服务器用PyTorch报错CUDA initialization:CUDA unknown error - AI开发平台ModelArts

命令，将必要的内核模块加载到系统中。但有时候也可能需要手动执行该命令。例如，在更新了NVIDIA驱动后，需要重新加载新版本的内核模块才能使变更生效。此外，如果使用了多个NVIDIA显卡，每个显卡都需要加载相应的内核模块才能正常工作。在这种情况下，也需要手动执行“nvidia-m

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
释放Standard专属资源池和删除网络 - AI开发平台ModelArts

在专属资源池列表中，在需要删除的资源池的右侧操作列选择“ > 删除”。在“删除资源池”页面，需在文本框中输入“DELETE”，单击“确定”，删除资源池。可切换“训练作业”、“推理服务”、“开发环境”页签查看资源池上创建的训练作业、部署的推理服务、创建的Notebook实例。图1 删除资源池释放游离节点

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
multi-lora - AI开发平台ModelArts
multi-lora - AI开发平台ModelArts

轻量化适配：无需改变原始模型结构，通过低秩矩阵的调整即可适配不同任务。多任务并行：支持同时加载多个LoRA模块，使得VLLM可以在不同任务间快速切换，提高多任务推理的效率。约束限制 multi-lora特性不能和Chunked Prefill特性一起使用。 multi-lora特性使用说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
自动学习/Workflow计费项 - AI开发平台ModelArts

择需要监控的节点/Workflow状态，在事件发生时发送消息通知。如果想使用消息通知，需要提前在自动学习、Workflow中开启消息通知功能。具体计费可见消息通知服务价格详情。按实际用量付费发送短信通知费用构成：短信通知条数发送电子邮件费用构成：电子邮件+外网下行流量

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
在ModelArts的Notebook中内置引擎不满足使用需要时，如何自定义引擎IPython Kernel？ - AI开发平台ModelArts

Kernel。刷新JupyterLab页面，可以看到自定义的虚拟环境Kernel。如下所示：单击my-py3-tensorflow-env图标，验证是否为当前环境，如下所示：清理环境。删除虚拟环境的IPython Kernel。 jupyter kernelspec uninstall

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
使用AI Gallery微调大师训练模型 - AI开发平台ModelArts

成”之外的类型（即自定义模型），则模型文件必须满足自定义模型规范（训练）才支持模型自定义训练。当使用自定义镜像进行模型微调时，要确认镜像是否满足自定义镜像规范，否则无法成功完成自定义训练。进入模型微调登录AI Gallery。单击“模型”进入模型列表。选择需要进行微调训练的模型，单击模型名称进入模型详情页。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
从0制作自定义镜像用于创建训练作业（PyTorch+CPU/GPU） - AI开发平台ModelArts

1”即为此自定义镜像的“SWR_URL”。 Step6 在ModelArts上创建训练作业登录ModelArts管理控制台，检查当前账号是否已完成访问授权的配置。如未完成，请参考快速配置ModelArts委托授权。针对之前使用访问密钥授权的用户，建议清空授权，然后使用委托进行授权。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

y/ # 兼容旧版本启动方式目录 |──tools/ # 针对昇腾云平台适配的功能补丁包 |──demo.yaml # 样例yaml配置文件 |──demo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 准备工作
图模式 - AI开发平台ModelArts
图模式 - AI开发平台ModelArts

开启PTA模式，如果不使用图模式，请关闭该环境变量 export PTA_TORCHAIR_DECODE_GEAR_ENABLE=1 # 开启动态分档功能 export PTA_TORCHAIR_DECODE_GEAR_LIST=2,4,6,8,16,32 # 设置动态分档的档位，根据

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
示例：从 0 到 1 制作自定义镜像并用于训练（PyTorch+CPU/GPU） - AI开发平台ModelArts

1”即为此自定义镜像的“SWR_URL”。 Step6 在ModelArts上创建训练作业登录ModelArts管理控制台，检查当前账号是否已完成访问授权的配置。如未完成，请参考使用委托授权。针对之前使用访问密钥授权的用户，建议清空授权，然后使用委托进行授权。在左侧导航栏中选择“训练管理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
如何在ModelArts的Notebook中上传下载OBS文件？ - AI开发平台ModelArts

请确保读取的OBS桶和Notebook处于同一站点区域，例如：都在华北-北京四站点。不支持跨站点访问OBS桶。具体请参见查看OBS桶与ModelArts是否在同一个区域。请确认操作Notebook的账号有权限读取OBS桶中的数据。如没有权限，请参见在ModelArts的Notebook中，如何访问其他账号的OBS桶？。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
如何查看ModelArts中正在收费的作业？ - AI开发平台ModelArts

后请及时停止Notebook实例或删除。使用EVS做存储时，需同时清理存储到EVS中的数据。 CodeLab计费：在体验CodeLab时，切换为付费规格后会收费，使用完后请在JupyterLab界面及时停止Notebook实例。训练作业：训练作业运行时会收取费用，使用完请及时停

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费FAQ
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

这句话。 value：具体的对话内容。 system：系统提示词，用来为整个对话设定场景或提供指导原则。 tools：描述可用的外部工具或功能的信息，这些工具可能被模型用来执行某些任务或获取更多信息。 [ { "conversations": [

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
使用ModelArts VSCode插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

存成一个镜像。方式一：保存镜像需要指定镜像名称、镜像标签、SWR服务的组织等信息，保存镜像需要等待几分钟时间，期间不能对Notebook有额外操作。 SWR服务的组织可以在SWR服务中进行创建，也可以使用SDK创建默认的SWR组织，默认最多只能创建5个组织。在“/home/m

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard开发环境
从0制作自定义镜像用于创建训练作业（Tensorflow+GPU） - AI开发平台ModelArts

2”即为此自定义镜像的“SWR_URL”。 Step7 在ModelArts上创建训练作业登录ModelArts管理控制台，检查当前账号是否已完成访问授权的配置。如未完成，请参考快速配置ModelArts委托授权。针对之前使用访问密钥授权的用户，建议清空授权，然后使用委托进行授权。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
LLaVA-NeXT基于Lite Server适配PyTorch NPU训练微调指导（6.3.912） - AI开发平台ModelArts

如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。检查是否安装docker。 docker -v #检查docker是否安装如尚未安装，运行以下命令安装docker。 yum install -y docker-engine

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
推理性能测试 - AI开发平台ModelArts

--num-scheduler-steps: 需和服务启动时配置的num-scheduler-steps一致。默认为1。 --enable-prefix-caching：服务端是否启用enable-prefix-caching特性，默认为false。脚本运行完成后，测试结果保存在benchmark_parallel

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
查看训练作业资源占用情况 - AI开发平台ModelArts

在“资源占用情况”窗口打开时，会定期向后台获取最新的资源使用率数据并刷新。操作一：如果训练作业使用多个计算节点，可以通过实例名称的下拉框切换节点。操作二：单击图例“cpuUsage”、“gpuMemUsage”、“gpuUtil”、“memUsage”“npuMemUsage

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业

总条数： 1628

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备Notebook - AI开发平台ModelArts

服务部署、启动、升级和修改时，资源不足如何处理？ - AI开发平台ModelArts

GP Vnt1裸金属服务器用PyTorch报错CUDA initialization:CUDA unknown error - AI开发平台ModelArts

释放Standard专属资源池和删除网络 - AI开发平台ModelArts

multi-lora - AI开发平台ModelArts

自动学习/Workflow计费项 - AI开发平台ModelArts

在ModelArts的Notebook中内置引擎不满足使用需要时，如何自定义引擎IPython Kernel？ - AI开发平台ModelArts

使用AI Gallery微调大师训练模型 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（PyTorch+CPU/GPU） - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

图模式 - AI开发平台ModelArts

示例：从 0 到 1 制作自定义镜像并用于训练（PyTorch+CPU/GPU） - AI开发平台ModelArts

如何在ModelArts的Notebook中上传下载OBS文件？ - AI开发平台ModelArts

如何查看ModelArts中正在收费的作业？ - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

使用ModelArts VSCode插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（Tensorflow+GPU） - AI开发平台ModelArts

LLaVA-NeXT基于Lite Server适配PyTorch NPU训练微调指导（6.3.912） - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

查看训练作业资源占用情况 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线