搜索_华为云

准备推理环境 - AI开发平台ModelArts

/etc/sysctl.conf sysctl -p | grep net.ipv4.ip_forward 步骤二：获取基础镜像建议使用官方提供的镜像部署推理服务。镜像地址{image_url}获取请参见表1。 docker pull {image_url} 步骤三：上传代码包和权重文件上传安

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） > 推理服务部署
准备推理环境 - AI开发平台ModelArts

/etc/sysctl.conf sysctl -p | grep net.ipv4.ip_forward 步骤二：获取基础镜像建议使用官方提供的镜像部署推理服务。镜像地址{image_url}获取请参见表1。 docker pull {image_url} 步骤三：上传代码包和权重文件上传安

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务部署
推理性能测试 - AI开发平台ModelArts

completions"拼接而成，部署成功后的在线服务详情页中可查看API接口公网地址。图1 API接口公网地址 --app-code：获取方式见访问在线服务（APP认证）。 --tokenizer：tokenizer路径，HuggingFace的权重路径。若服务部署在note

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
终止训练作业 - AI开发平台ModelArts

和中划线的名称。 workspace_id String 指定作业所处的工作空间，默认值为“0”。 description String 对训练作业的描述，默认为“NULL”，字符串的长度限制为[0, 256]。 create_time Long 训练作业创建时间戳，单位为毫秒，

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
推理性能测试 - AI开发平台ModelArts

completions"拼接而成。部署成功后的在线服务详情页中可查看API接口公网地址。图1 API接口公网地址 --app-code：获取方式见访问在线服务（APP认证）。 --tokenizer：tokenizer路径，HuggingFace的权重路径。若服务部署在Note

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
查询训练作业详情 - AI开发平台ModelArts

和中划线的名称。 workspace_id String 指定作业所处的工作空间，默认值为“0”。 description String 对训练作业的描述，默认为“NULL”，字符串的长度限制为[0, 256]。 create_time Long 训练作业创建时间戳，单位为毫秒，

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
训练精度测试 - AI开发平台ModelArts

为增加精度评测的稳定性及进一步确保训练精度，使用多个数据集【MMLU、CEVAL】评测，执行过程如下：获取到训练权重后使用ascendfactory-cli、eval接口用mmlu、ceval数据集对训练后的结果进行评测 test-benchmark目录目录下执行命令 ascendfactory-cli

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 训练benchmark工具
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本案例仅支持在专属资源池上运行。支持的模型列表本方案支持以下模型的训练，如表1所示。表1 代码包中适配的模型序号支持模型支持模型参数量权重文件获取地址 1 Llama2 llama2-7b https://huggingface.co/meta-llama/Llama-2-7b-chat-hf

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905）
训练精度测试 - AI开发平台ModelArts

为增加精度评测的稳定性及进一步确保训练精度，使用多个数据集【MMLU、CEVAL】评测，执行过程如下：获取到训练权重后使用ascendfactory-cli、eval接口用mmlu、ceval数据集对训练后的结果进行评测 test-benchmark目录目录下执行命令 ascendfactory-cli

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.5.901） > 训练benchmark工具
使用Notebook进行代码调试 - AI开发平台ModelArts

注册镜像。登录ModelArts控制台，在左侧导航栏选择“镜像管理”，进入镜像管理页面。单击“注册镜像”，镜像源即为推送到SWR中的镜像。请将完整的SWR地址复制到这里即可，或单击可直接从SWR选择自有镜像进行注册，类型加上“GPU”，如图1所示。图1 注册镜像登录ModelArts管理控制台，在左侧导航栏中选择“开发空间

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
我的Gallery介绍 - AI开发平台ModelArts

“我的订阅”：可以查看个人订阅的算法信息，如发布者、应用控制台、剩余配额等。通过右侧的“取消订阅”或“找回订阅”可以管理已订阅的算法。取消订阅后，ModelArts管理控制台算法管理模块-我的订阅列表中将不再展示该算法。已取消订阅的算法可以找回订阅，并在原配额约束下可以继续使用该算法。我的资产

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版）
使用ModelArts Studio的DeepSeek-R1模型框架实现对话问答 - AI开发平台ModelArts

S预置服务。（可选）在“模型推理”页面的“预置服务”页签，单击DeepSeek-R1服务右侧的“调用说明”，获取调用实例代码，修改接口信息和API Key，快速实现端外调用。具体操作，请参见调用MaaS部署的模型服务。步骤三：部署模型服务如果免费Token额度用完后，还要继

 帮助中心 > AI开发平台ModelArts > 快速入门
从OBS目录导入数据规范说明 - AI开发平台ModelArts

物体检测支持两种格式： ModelArts PASCAL VOC 1.0 物体检测的简易模式要求用户将标注对象和标注文件存储在同一目录，并且一一对应，如标注对象文件名为“IMG_20180919_114745.jpg”，那么标注文件的文件名应为“IMG_20180919_114745.xml”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集 > 从OBS导入数据到ModelArts数据集
推理性能测试 - AI开发平台ModelArts

completions"拼接而成。部署成功后的在线服务详情页中可查看API接口公网地址。图1 API接口公网地址 --app-code：获取方式见访问在线服务（APP认证）。 --tokenizer：tokenizer路径，HuggingFace的权重路径。若服务部署在Note

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
ModelArts与其他服务的关系 - AI开发平台ModelArts

训练作业输出的模型存储在指定的OBS中。训练作业的过程日志存储在指定的OBS中。 AI应用管理训练作业结束后，其生成的模型存储在OBS中，创建AI应用时，从OBS中导入已有的模型文件。部署上线将存储在OBS中的模型部署上线。全局配置 - 获取访问授权（使用委托或访问密钥授权），以便ModelArts可

 帮助中心 > AI开发平台ModelArts > 常见问题 > 历史文档待下线
与其他云服务的关系 - AI开发平台ModelArts

训练作业输出的模型存储在指定的OBS中。训练作业的过程日志存储在指定的OBS中。模型管理训练作业结束后，其生成的模型存储在OBS中，创建模型时，从OBS中导入已有的模型文件。部署上线将存储在OBS中的模型部署上线。全局配置 - 获取访问授权（使用委托或访问密钥授权），以便ModelArts可以

 帮助中心 > AI开发平台ModelArts > 产品介绍
日志提示"Permission denied" - AI开发平台ModelArts

sh，脚本里面有某些环境变量在新版本下发的作业中并不存在这些环境变量导致。可能原因是使用Python file接口并发读写同一文件。处理方法对挂载盘的数据加权限，可以改为与训练容器内相同的用户组（1000），假如/nas盘是挂载路径，执行如下代码。 chown -R 1000：1000

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 权限问题
订阅免费模型 - AI开发平台ModelArts

Gallery中订阅的模型时，可以取消订阅该模型。取消订阅后，ModelArts管理控制台“AI应用管理 > AI应用 > 我的订阅”列表中将不再展示该模型；当需要再次使用该模型时，可以找回订阅，ModelArts管理控制台“AI应用管理 > AI应用 > 我的订阅”列表中也会再次展示该模型。 HiLens技能不支持取消订阅。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 订阅使用
从训练作业中导入模型文件创建模型 - AI开发平台ModelArts

从训练作业中导入模型文件创建模型在ModelArts中创建训练作业，并完成模型训练，在得到满意的模型后，可以将训练后得到的模型导入至模型管理，方便统一管理，同时支持将模型快速部署上线为服务。约束与限制针对使用订阅算法的训练作业，无需推理代码和配置文件，其生成的模型可直接导入ModelArts。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
查询训练作业列表 - AI开发平台ModelArts

和中划线的名称。 workspace_id String 指定作业所处的工作空间，默认值为“0”。 description String 对训练作业的描述，默认为“NULL”，字符串的长度限制为[0, 256]。 create_time Long 训练作业创建时间戳，单位为毫秒，

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业

总条数： 887

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备推理环境 - AI开发平台ModelArts

准备推理环境 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

查询训练作业详情 - AI开发平台ModelArts

训练精度测试 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

训练精度测试 - AI开发平台ModelArts

使用Notebook进行代码调试 - AI开发平台ModelArts

我的Gallery介绍 - AI开发平台ModelArts

使用ModelArts Studio的DeepSeek-R1模型框架实现对话问答 - AI开发平台ModelArts

从OBS目录导入数据规范说明 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

ModelArts与其他服务的关系 - AI开发平台ModelArts

与其他云服务的关系 - AI开发平台ModelArts

日志提示"Permission denied" - AI开发平台ModelArts

订阅免费模型 - AI开发平台ModelArts

从训练作业中导入模型文件创建模型 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线