搜索_华为云

创建训练作业版本 - AI开发平台ModelArts

user_image_url 否 String 自定义镜像训练作业的自定义镜像的SWR-URL。如：“100.125.5.235:20202/jobmng/custom-cpu-base:1.0”。 user_command 否 String 自定义镜像训练作业的自定义镜像的容器的启动命令。形式为：“bash

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
查询用户所有DevServer实例列表 - AI开发平台ModelArts

ServerImageResponse 参数参数类型描述 arch String 服务器镜像架构类型。 ARM X86 image_id String 服务器镜像ID。 name String 服务器镜像名称。 server_type String 服务器类型。枚举值如下： BMS：裸金属服务器

 帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
预置算法运行故障 - AI开发平台ModelArts

使用订阅算法训练结束后没有显示模型评估结果创建训练任务并成功运行, 但是发布到至AI Gallery时, 版本那块显示状态异常使用python3.6-torch1.4版本镜像环境安装MMCV报错父主题：训练作业

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
训练作业运行失败排查指导 - AI开发平台ModelArts

capabilities sm_37 sm_50 sm_60 sm_70'”。原因：训练作业使用的镜像CUDA版本只支持sm_37、sm_50、sm_60和sm_70的加速卡，不支持sm_80。处理建议：使用自定义镜像创建训练作业，并安装高版本的cuda以及对应的PyTorch版本。查看训练作业

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

# 本教程中需要的模型代码 └── Dockerfile # 构建镜像 └── qwen-vl_install.sh # 安装模型运行环境

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 准备工作
Standard推理部署 - AI开发平台ModelArts

Standard推理服务支持VPC直连的高速访问通道配置 ModelArts Standard的WebSocket在线服务全流程开发从0-1制作自定义镜像并创建模型使用AppCode认证鉴权方式进行在线预测

 帮助中心 > AI开发平台ModelArts > 最佳实践
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

训练作业中存在2个代码目录，一个是从OBS上传到ModelArts Standard训练容器中的代码目录OBS_CODE_DIR，一个是后续构建新镜像步骤ECS中构建新镜像（二选一）中镜像的代码目录CODE_DIR。修改代码如图1。图1 修改区分训练作业中2个代码目录使用环境变量SAVE_PATH重新覆

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 准备工作
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

准备AscendSpeed训练代码、分词器Tokenizer和推理代码。准备数据准备训练数据，可以用本案使用的数据集，也可以使用自己准备的数据集。准备镜像准备训练模型适用的容器镜像。预训练预训练介绍如何进行预训练，包括训练数据处理、超参配置、训练任务、性能查看。微调训练 SFT全参微调介绍如何

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.907）
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

# 本教程中需要的模型代码 └── Dockerfile # 构建镜像 └── qwen-vl_install.sh # 安装模型运行环境

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 准备工作
查看批量服务的事件 - AI开发平台ModelArts

Insufficient memory. 根据补充信息，了解资源不足详情，参考FAQ处理。正常开始构建镜像。 Start to build image. - 异常构建模型(xxx) 镜像失败，构建日志:\nxxx。 Failed to build image for model (%s

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理批量推理作业
查看在线服务的事件 - AI开发平台ModelArts

Insufficient memory. 根据补充信息，了解资源不足详情，参考FAQ处理。正常开始构建镜像。 Start to build image. - 异常构建模型(xxx) 镜像失败，构建日志:\nxxx。 Failed to build image for model (%s

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
查询模型runtime - AI开发平台ModelArts

deleting (下线中) image_source Array of strings 镜像来源，目前共两种： base_image (基础镜像) uniform_image (统一镜像) 表6 Accelerator 参数参数类型描述 type String 加速卡类型，目前共三种：

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
推理场景介绍 - AI开发平台ModelArts

254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。镜像版本本教程中用到基础镜像地址和配套版本关系如下表所示，请提前了解。表1 基础容器镜像地址镜像用途镜像地址配套版本基础镜像 swr.cn-southwest-2.myhuaweicloud.co

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.906）
GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

安装Megatron-DeepSpeed框架。使用root用户SSH的方式登录GPU裸金属服务器。具体登录方式请参见SSH密钥方式登录裸金属服务器。拉取pytorch镜像，可以选择常用的镜像源进行下载。 docker pull nvcr.io/nvidia/pytorch:21.10-py3 启动容器。 docker

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源使用
获取训练作业支持的AI预置框架 - AI开发平台ModelArts

参数类型描述 cpu_image_url String cpu规格下对应镜像。 gpu_image_url String gpu或者Ascend规格下对应镜像。 image_version String 镜像版本。请求示例如下以查询北京四训练作业所有的公共引擎规格为例（引擎过多，只显示部分）。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

准备AscendSpeed训练代码、分词器Tokenizer和推理代码。准备数据准备训练数据，可以用本案使用的数据集，也可以使用自己准备的数据集。准备镜像准备训练模型适用的容器镜像。预训练预训练介绍如何进行预训练，包括训练数据处理、超参配置、训练任务、性能查看。微调训练 SFT全参微调介绍如何

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.906）
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

训练作业中存在2个代码目录，一个是从OBS上传到ModelArts Standard训练容器中的代码目录OBS_CODE_DIR，一个是后续构建新镜像步骤ECS中构建新镜像中镜像的代码目录CODE_DIR。修改代码如图1。图1 修改区分训练作业中2个代码目录使用环境变量SAVE_PATH重新覆盖权

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作
推理场景介绍 - AI开发平台ModelArts

254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。镜像版本本教程中用到基础镜像地址和配套版本关系如下表所示，请提前了解。表1 基础容器镜像地址镜像用途镜像地址配套版本基础镜像 swr.cn-southwest-2.myhuaweicloud.co

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910）
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

├── Dockerfile # 推理构建镜像dockerfile ├── build_image.sh # 推理构建镜像启动脚本 ├──llm_tools # 推理工具包 ├──AutoSmoothQuant

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

├── Dockerfile # 推理构建镜像dockerfile ├── build_image.sh # 推理构建镜像启动脚本 ├──llm_tools # 推理工具包 ├──AutoSmoothQuant

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 准备工作

总条数： 821

上一页
1
...
31
32
33
...
42
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建训练作业版本 - AI开发平台ModelArts

查询用户所有DevServer实例列表 - AI开发平台ModelArts

预置算法运行故障 - AI开发平台ModelArts

训练作业运行失败排查指导 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

Standard推理部署 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

查看批量服务的事件 - AI开发平台ModelArts

查看在线服务的事件 - AI开发平台ModelArts

查询模型runtime - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

获取训练作业支持的AI预置框架 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线