搜索_华为云

计算规格说明 - AI开发平台ModelArts

微调大师：“训练中” AI应用：“运行中” 在线推理服务：“运行中” 计费规则资源整点扣费，按需计费。计费的最小单位为秒，话单上报后的每一小时对用户账号进行一次扣费。如果使用过程中暂停、终止了消耗资源的AI Gallery工具链服务，即服务不处于计费的状态中，则系统不会立即扣

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
创建Notebook实例后无法打开页面，如何处理？ - AI开发平台ModelArts

打开Notebook时显示空白，请清理浏览器缓存后尝试重新打开。检查浏览器是否安装了过滤广告组件，如果是，请关闭该组件。报错404 如果是IAM用户在创建实例时出现此错误，表示此IAM用户不具备对应存储位置（OBS桶）的操作权限。解决方法：使用账号登录OBS，并将对应OBS桶的访问权限

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > Notebook实例常见错误
Open-Clip基于DevServer适配PyTorch NPU训练指导 - AI开发平台ModelArts

chown -R ma-user:ma-group open_clip exit 在步骤2打开的终端中，使用默认用户ma-user安装源码。 cd open_clip make install 在步骤2打开的终端中，使用默认用户ma-user安装依赖。 pip install -r requirements-training

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

场景介绍方案概览本文档利用训练框架LlamaFactory+华为自研Ascend Snt9B硬件，为用户提供了常见主流开源大模型在ModelArts Lite DevServer上的微调方案，包括sft全参和lora 微调。本方案目前仅适用于部分企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907）
配置Lite Cluster存储 - AI开发平台ModelArts

如果没有挂载任何外部存储，此时可用存储空间根据dockerBaseSize的配置来决定，可访问的存储空间比较小，因此建议通过挂载外部存储空间解决存储空间受限问题。容器中挂载存储有多种方式，不同的场景下推荐的存储方式不一样，详情如表1所示。容器存储的基础知识了解请参见存储基础知识，有助您理解本章节内容。您可查

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
SD3 Diffusers框架基于DevServer适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

软件配套版本表1 获取软件分类名称获取路径插件代码包 AscendCloud-6.3.907软件包中的AscendCloud-AIGC-6.3.907-xxx.zip 文件名中的xxx表示具体的时间戳，以包名发布的实际时间为准。获取路径：Support-E 说明：如果上述软

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本案例需要创建一个Notebook，以便能够通过它访问SFS Turbo服务。随后，通过Notebook将OBS中的数据上传至SFS Turbo，并对存储在SFS Turbo中的数据执行编辑操作。预训练预训练介绍如何进行预训练，包括训练数据处理、超参配置、创建训练任务及性能查看。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907）
ModelArts - AI开发平台ModelArts
ModelArts - AI开发平台ModelArts

至ModelArts中统一管理。同时，您可以订阅AI Gallery中的算法构建模型。不管是您创建的算法，还是您订阅的算法，支持在ModelArts中快速创建训练作业，获得您想要的模型。发布区域：华北-北京一、华北-北京四、华北-乌兰察布一、华东-上海一、华南-广州、西南-贵

 帮助中心 > AI开发平台ModelArts > 功能总览
推理场景介绍 - AI开发平台ModelArts

推理场景介绍方案概览本方案介绍了在ModelArts的Lite DevServer上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本案例需要创建一个Notebook，以便能够通过它访问SFS Turbo服务。随后，通过Notebook将OBS中的数据上传至SFS Turbo，并对存储在SFS Turbo中的数据执行编辑操作。预训练预训练介绍如何进行预训练，包括训练数据处理、超参配置、创建训练任务及性能查看。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908）
创建AI应用失败，如何定位和处理问题？ - AI开发平台ModelArts

创建AI应用任务下发成功，但最终AI应用创建失败。需要从以下几个方面进行排查：在AI应用详情页面，查看“事件”页签中的事件信息。根据事件信息分析AI应用失败原因，进行处理。如果AI应用状态为“构建失败”，可以在AI应用详情页面，查看“事件”页签中的“查看构建日志”。构建日志中有对应的构建镜像失败的详细原因，根据构建失败的原因进行排查处理。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > AI应用管理
训练的权重转换说明 - AI开发平台ModelArts

sh脚本，自定义环境变量的值，并在脚本的首行中添加 cd /home/ma-user/work/llm_train/AscendSpeed/ModelLink 命令，随后在Notebook中运行该脚本。其中环境变量详细介绍如下：表1 权重转换脚本中的环境变量参数示例参数说明 $1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908） > 训练脚本说明
上传镜像 - AI开发平台ModelArts
上传镜像 - AI开发平台ModelArts

请自定义组织名称，本示例使用“deep-learning”，下面的命令中涉及到组织名称“deep-learning”也请替换为自定义的值。选择左侧导航栏的“总览”，单击页面右上角的“登录指令”，在弹出的页面中单击复制登录指令。此处生成的登录指令有效期为24小时，如果需要长期有

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

场景介绍方案概览本文档利用训练框架PyTorch_npu+华为自研Ascend Snt9B硬件，为用户提供了常见主流开源大模型在ModelArts Lite DevServer上的预训练和全量微调方案。训练框架使用的是ModelLink。本方案目前仅适用于部分企业客户，完成

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907）
创建和修改工作空间 - AI开发平台ModelArts

domain_name为用户所属的帐号名。 cn-north-1为项目名，代表服务的部署区域。返回状态码“201 Created”，在响应Header中获取“X-Subject-Token”的值即为Token，如下所示： x-subject-token →MIIZmgYJKoZIh

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
FLUX.1基于DevServer适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

置即可，后续在windows上启动服务后需要加载使用。图5 下载workflow文件步骤六：ComfyUI 0.2.2 服务调用获取容器IP地址在已启动的容器内，使用ifconfig命令获取容器IP，记为${container_ip_address}，本例中为172.17

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
创建Notebook实例后无法打开页面，如何处理？ - AI开发平台ModelArts

打开Notebook时显示空白，请清理浏览器缓存后尝试重新打开。检查浏览器是否安装了过滤广告组件，如果是，请关闭该组件。报错404 如果是IAM用户在创建实例时出现此错误，表示此IAM用户不具备对应存储位置（OBS桶）的操作权限。解决方法：使用账号登录OBS，并将对应OBS桶的访问权限

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 实例故障
GPU A系列裸金属服务器RoCE带宽不足如何解决？ - AI开发平台ModelArts

d/nv_peer_mem start 如果执行失败，可能是未加载nv_peer_mem.conf至/etc/infiniband/中或nv_peer_mem不在/etc/init.d/中。若找不到相关文件的问题，可以搜索相关文件在哪里，然后复制到指定目录，例如可执行如下命令： cp /tmp/nvidia-peer-memory-1

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
Standard模型部署 - AI开发平台ModelArts

Standard提供模型、服务管理能力，支持多厂商多框架多功能的镜像和模型统一纳管。通常AI模型部署和规模化落地非常复杂。例如，智慧交通项目中，在获得训练好的模型后，需要部署到云、边、端多种场景。如果在端侧部署，需要一次性部署到不同规格、不同厂商的摄像机上，这是一项非常耗时、费力的巨大

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本案例需要创建一个Notebook，以便能够通过它访问SFS Turbo服务。随后，通过Notebook将OBS中的数据上传至SFS Turbo，并对存储在SFS Turbo中的数据执行编辑操作。预训练预训练介绍如何进行预训练，包括训练数据处理、超参配置、创建训练任务及性能查看。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909）

总条数： 1459

上一页
1
...
67
68
69
...
73
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

计算规格说明 - AI开发平台ModelArts

创建Notebook实例后无法打开页面，如何处理？ - AI开发平台ModelArts

Open-Clip基于DevServer适配PyTorch NPU训练指导 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

配置Lite Cluster存储 - AI开发平台ModelArts

SD3 Diffusers框架基于DevServer适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

ModelArts - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

创建AI应用失败，如何定位和处理问题？ - AI开发平台ModelArts

训练的权重转换说明 - AI开发平台ModelArts

上传镜像 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

创建和修改工作空间 - AI开发平台ModelArts

FLUX.1基于DevServer适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

创建Notebook实例后无法打开页面，如何处理？ - AI开发平台ModelArts

GPU A系列裸金属服务器RoCE带宽不足如何解决？ - AI开发平台ModelArts

Standard模型部署 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线