搜索_华为云

使用大模型在ModelArts Standard创建模型部署在线服务 - AI开发平台ModelArts

服务部署时，默认情况下，动态加载的模型包位于临时磁盘空间，服务停止时已加载的文件会被删除，再次启动时需要重新加载。为了避免反复加载，平台允许使用资源池节点的本地存储空间来加载模型包，并在服务停止和重启时仍有效（通过哈希值保证数据一致性）使用大模型要求用户采用自定义引擎，并开启

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
创建和保存Manifest文件 - AI开发平台ModelArts

息及其标签信息Annotation，然后将若干个样本组成Manifest。保存的时候调用save接口，将session信息传入，即可保存到指定路径。 from modelarts.dataset.format.manifest.annotation import Annotation

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > Manifest管理
multi-lora - AI开发平台ModelArts
multi-lora - AI开发平台ModelArts

ggingface格式，当前支持QKV-proj、O-proj、gate_up_proj、down_proj模块的挂载。发请求时model指定为lora1或者lora2即为LoRA推理。 --max-lora-rank表示挂载lora的最大rank数量，支持8、16、32、64，

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
准备数据（可选） - AI开发平台ModelArts

新dataset_info.json文件；请务必在dataset_info.json文件中添加数据集描述；具体示例如下。上传自定义数据到指定目录将下载的原始数据存放在{work_dir}/llm_train/AscendFactory/data目录下。具体步骤如下：解压data

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 准备工作
快速开始 - AI开发平台ModelArts
快速开始 - AI开发平台ModelArts

行Session鉴权。登录ModelArts控制台，在“开发环境 > Notebook”中创建Notebook实例，在Terminal或ipynb文件中直接调用ModelArts SDK的接口。在Notebook中调用SDK，可直接参考接口说明，执行OBS管理、作业管理、模型管理和服务管理等操作。

帮助中心 > AI开发平台ModelArts > SDK参考
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

操作任务流程说明阶段任务说明准备工作准备资源本教程案例是基于ModelArts Standard运行，需要购买ModelArts专属资源池。准备权重准备对应模型的权重文件。准备代码准备AscendCloud-6.3.908-xxx.zip。准备镜像准备推理模型适用的容器镜像。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
常见的磁盘空间不足的问题和解决办法 - AI开发平台ModelArts

数据处理过程中对数据进行解压，导致数据大小膨胀，将"/cache"目录空间用完。数据未保存至/cache目录或者/home/ma-user/目录（/cache会软连接成/home/ma-user/），导致数据占满系统目录。系统目录仅支持系统功能基本运行，无法支持大数据存储。部分训练任务会在训练过程中生

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
模型管理 - AI开发平台ModelArts
模型管理 - AI开发平台ModelArts

什么样的？通过OBS导入模型时，如何编写打印日志代码才能在ModelArts日志查询界面看到日志通过OBS创建模型时，构建日志中提示pip下载包失败通过自定义镜像创建模型失败导入模型后部署服务，提示磁盘不足创建模型成功后，部署服务报错，如何排查代码问题自定义镜像导入配置运行时依赖无效

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署
GPU A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？ - AI开发平台ModelArts

和nvidia-fabricmanager等软件后，驱动程序可能已经正确配置，从而解决了这个问题。硬件问题：如果GPU之间的NVLINK连接存在硬件故障，那么这可能会导致带宽受限。重新安装软件后，重启系统，可能触发了某种硬件自检或修复机制，从而恢复了正常的带宽。系统负载问题：

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

--resume-download meta-llama/Llama-2-70b-chat-hf --local-dir <模型下载路径> 如果要下载指定版本的模型文件，则命令如下： huggingface-cli download --resume-download meta-llama/Llama-2-70b-chat-hf

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

--resume-download meta-llama/Llama-2-70b-chat-hf --local-dir <模型下载路径> 如果要下载指定版本的模型文件，则命令如下： huggingface-cli download --resume-download meta-llama/Llama-2-70b-chat-hf

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作
查询数据集列表 - AI开发平台ModelArts

String 模糊匹配数据集名称，默认为空。 offset 否 Integer 分页列表的起始页，默认为0。 limit 否 Integer 指定每一页返回的最大条目数，取值范围[1,100]，默认为10。父主题：数据集管理

 帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 数据集管理
数据导入方式介绍 - AI开发平台ModelArts

文件两种导入方式，需要将导入的数据或Manifest文件提前存储至OBS目录中。本地上传：将本地数据直接通过Internet上传至OBS指定目录后，再导入数据集。表格型数据来源表格数据集支持从5种数据源导入数据，分别为对象存储服务（OBS）、数据仓库服务（DWS）、数据湖探

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

--resume-download meta-llama/Llama-2-70b-chat-hf --local-dir <模型下载路径> 如果要下载指定版本的模型文件，则命令如下： huggingface-cli download --resume-download meta-llama/Llama-2-70b-chat-hf

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

--resume-download meta-llama/Llama-2-70b-chat-hf --local-dir <模型下载路径> 如果要下载指定版本的模型文件，则命令如下： huggingface-cli download --resume-download meta-llama/Llama-2-70b-chat-hf

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

--resume-download meta-llama/Llama-2-70b-chat-hf --local-dir <模型下载路径> 如果要下载指定版本的模型文件，则命令如下： huggingface-cli download --resume-download meta-llama/Llama-2-70b-chat-hf

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
ModelArts权限管理基本概念 - AI开发平台ModelArts

选择授权范围方案”可以选择“指定区域项目资源”，如果授权时指定了区域（如华北-北京4）对应的项目（cn-north-4），则该权限仅对此项目生效；简单的做法是直接选择“所有资源”。 ModelArts也支持企业项目，所以选择授权范围方案时，也可以指定企业项目。具体操作参见《创建用户组并授权》。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理
昇腾云服务6.3.908版本说明 - AI开发平台ModelArts

支持如下框架或模型基于DevServer的PyTorch NPU推理： Wav2Lip OpenSora1.2 OpenSoraPlan1.0 支持如下框架或模型基于DevServer的PyTorch NPU的训练： Diffusers Kohya_ss Wav2Lip InternVL2 OpenSora1.2 OpenSoraPlan1

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
权限管理 - AI开发平台ModelArts
权限管理 - AI开发平台ModelArts

选择授权范围方案”可以选择“指定区域项目资源”，如果授权时指定了区域（如华北-北京4）对应的项目（cn-north-4），则该权限仅对此项目生效；简单的做法是直接选择“所有资源”。 ModelArts也支持企业项目，所以选择授权范围方案时，也可以指定企业项目。具体操作参见《创建用户组并授权》。

帮助中心 > AI开发平台ModelArts > 产品介绍
动态挂载OBS并行文件系统 - AI开发平台ModelArts

方式2：API模式动态挂载API接口已发布至华北-北京四和华东-上海一站点。请参考JupyterLab主页介绍、在JupyterLab中新建ipynb文件，新建一个ipynb文件然后执行脚本。挂载脚本代码示例如下。更多API参数介绍请参考动态挂载OBS。 import os from json

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例

总条数： 1387

上一页
1
...
63
64
65
...
70
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用大模型在ModelArts Standard创建模型部署在线服务 - AI开发平台ModelArts

创建和保存Manifest文件 - AI开发平台ModelArts

multi-lora - AI开发平台ModelArts

准备数据（可选） - AI开发平台ModelArts

快速开始 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

常见的磁盘空间不足的问题和解决办法 - AI开发平台ModelArts

模型管理 - AI开发平台ModelArts

GPU A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？ - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

查询数据集列表 - AI开发平台ModelArts

数据导入方式介绍 - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

ModelArts权限管理基本概念 - AI开发平台ModelArts

昇腾云服务6.3.908版本说明 - AI开发平台ModelArts

权限管理 - AI开发平台ModelArts

动态挂载OBS并行文件系统 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线