搜索_华为云

LoRA微调训练 - AI开发平台ModelArts

LoRA微调训练步骤一上传训练权重文件和数据集如果在准备代码和数据阶段已经上传权重文件和数据集到容器中，可以忽略此步骤。如果未上传训练权重文件和数据集到容器中，具体参考上传代码和权重文件到工作环境和上传数据到指定目录章节完成。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910）
SFT全参微调训练任务 - AI开发平台ModelArts

SFT全参微调训练任务步骤一上传训练权重文件和数据集如果在准备代码和数据阶段已经上传权重文件和数据集到容器中，可以忽略此步骤。如果未上传训练权重文件和数据集到容器中，具体参考上传代码和权重文件到工作环境和上传数据到指定目录章节完成。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911）
推理性能测试 - AI开发平台ModelArts

约束限制创建在线服务时，每秒服务流量限制默认为100次，若静态benchmark的并发数（parallel-num参数）或动态benchmark的请求频率（request-rate参数）较高，会触发推理平台的流控，请在ModelArts Standard“在线服务”详情页修改服务流量限制。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

ebook。 Step2 准备权重文件将OBS中的模型权重上传到Notebook的工作目录/home/ma-user/work/下。上传代码参考如下。 import moxing as mox obs_dir = "obs://${bucket_name}/${folder-name}"

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
自定义模型规范 - AI开发平台ModelArts

容为空，都将不能正常部署在线推理服务。表2 gallery_inference文件列表文件类型文件说明 “inference.py” 必选文件，推理脚本文件，定义了自定义模型的推理处理方式，包含初始化推理（init）和输入输出（call函数）。代码示例请参见inference

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

ebook。 Step2 准备权重文件将OBS中的模型权重上传到Notebook的工作目录/home/ma-user/work/下。上传代码参考如下。 import moxing as mox obs_dir = "obs://${bucket_name}/${folder-name}"

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
从OBS下载文件 - AI开发平台ModelArts

从OBS下载文件示例代码在ModelArts Notebook平台，Session鉴权无需输入鉴权参数。其它平台的Session鉴权请参考Session鉴权。 1 2 3 from modelarts.session import Session session = Session()

帮助中心 > AI开发平台ModelArts > SDK参考 > OBS管理
推理性能测试 - AI开发平台ModelArts

约束限制创建在线服务时，每秒服务流量限制默认为100次，若静态benchmark的并发数（parallel-num参数）或动态benchmark的请求频率（request-rate参数）较高，会触发推理平台的流控，请在ModelArts Standard“在线服务”详情页修改服务流量限制。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
在推理生产环境中部署推理服务 - AI开发平台ModelArts

型大于60G，请提工单扩容。 Step3 部署在线服务将Step2 部署模型中创建的AI应用部署为一个在线服务，用于推理调用。在ModelArts控制台，单击“部署上线 > 在线服务 > 部署”，开始部署在线服务。图5 部署在线服务设置部署服务名称，选择Step2 部署模

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
在Notebook中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

单击新建的模型名称左侧的小三角形，展开模型的版本列表。在操作列单击“部署 > 在线服务”，跳转至在线服务的部署页面。在部署页面，参考如下说明填写关键参数。 “名称”：按照界面提示规则自定义一个在线服务的名称，也可以使用默认值。 “资源池”：选择“公共资源池”。 “模型来源”和

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
在推理生产环境中部署推理服务 - AI开发平台ModelArts

型大于60G，请提工单扩容。 Step3 部署在线服务将Step2 部署模型中创建的AI应用部署为一个在线服务，用于推理调用。在ModelArts控制台，单击“部署上线 > 在线服务 > 部署”，开始部署在线服务。图5 部署在线服务设置部署服务名称，选择Step2 部署模

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
创建生产训练作业（新版页面） - AI开发平台ModelArts

训练配置参数名称说明代码存储方式选择代码存储方式。 “对象OBS存储”：如果训练代码存放在OBS中，则选择“对象OBS存储”。 “文件存储”：如果训练代码存放在文件存储中，则选择“文件存储”。如果不可见，则表示不支持文件存储。代码目录仅当“代码来源”选择“对象OBS存储”时才显示该参数。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
推理性能测试 - AI开发平台ModelArts

约束限制创建在线服务时，每秒服务流量限制默认为100次，如果静态benchmark的并发数（parallel-num参数）或动态benchmark的请求频率（request-rate参数）较高，会触发推理平台的流控，请在ModelArts Standard“在线服务”详情页修改服务流量限制。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
推理性能测试 - AI开发平台ModelArts

约束限制创建在线服务时，每秒服务流量限制默认为100次，如果静态benchmark的并发数（parallel-num参数）或动态benchmark的请求频率（request-rate参数）较高，会触发推理平台的流控，请在ModelArts Standard“在线服务”详情页修改服务流量限制。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
启动推理服务 - AI开发平台ModelArts

其他参数与正常启服务一致即可。具体参考本文单机场景下OpenAI服务的API接口启动在线推理服务方式。推理请求测试使用命令测试推理服务是否正常启动。服务启动命令中的参数设置请参见启动在线推理服务。通过OpenAI服务API接口启动服务使用以下推理测试命令。${docker

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） > 推理服务部署
在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

正常”。单击新建的模型名称左侧的小三角形，展开模型的版本列表。在操作列单击“部署 > 在线服务”，跳转至在线服务的部署页面。在部署页面，参考如下说明填写关键参数。 “名称”：自定义一个在线服务的名称，也可以使用默认值。 “资源池”：选择“公共资源池”。 “模型来源”和“选择模型及版本”：会自动选择模型和版本号。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
自动学习生成的模型，存储在哪里？支持哪些其他操作？ - AI开发平台ModelArts

自动学习生成的模型，不支持下载使用。图1 自动学习生成的模型自动学习生成的模型，支持哪些其他操作支持部署为在线服务、批量服务或边缘服务。在自动学习页面中，仅支持部署为在线服务，如需部署为批量服务或边缘服务，可在“模型部署”页面部署。支持发布至市场将产生的模型发布至AI Gallery，共享给其他用户。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习
启动推理服务 - AI开发平台ModelArts

其他参数与正常启服务一致即可。具体参考本文单机场景下OpenAI服务的API接口启动在线推理服务方式。推理请求测试使用命令测试推理服务是否正常启动。服务启动命令中的参数设置请参见启动在线推理服务。通过OpenAI服务API接口启动服务使用以下推理测试命令。${docker

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务部署
从OBS下载文件夹 - AI开发平台ModelArts

从OBS下载文件夹示例代码在ModelArts Notebook平台，Session鉴权无需输入鉴权参数。其它平台的Session鉴权请参考Session鉴权。 1 2 3 from modelarts.session import Session session = Session()

帮助中心 > AI开发平台ModelArts > SDK参考 > OBS管理
上传算法至SFS - AI开发平台ModelArts

器中预置的环境变量。训练容器环境变量详细介绍可参考查看训练容器环境变量。通过obsutils，将代码文件夹放到OBS上，然后通过OBS将代码传至SFS相应目录中。在SFS中将代码文件Swin-Transformer-main设置归属为ma-user。 chown -R ma-user:ma-group

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 多机多卡

总条数： 1584

上一页
1
...
34
35
36
...
80
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

LoRA微调训练 - AI开发平台ModelArts

SFT全参微调训练任务 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

自定义模型规范 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

从OBS下载文件 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

在Notebook中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

创建生产训练作业（新版页面） - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

启动推理服务 - AI开发平台ModelArts

在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

自动学习生成的模型，存储在哪里？支持哪些其他操作？ - AI开发平台ModelArts

启动推理服务 - AI开发平台ModelArts

从OBS下载文件夹 - AI开发平台ModelArts

上传算法至SFS - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线