搜索_华为云

使用ModelArts VSCode插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

保存镜像”，进入“保存镜像”页面，设置组织、镜像名称、镜像版本和描述信息后单击“确认”保存镜像。此时Notebook会冻结，需要等待几分钟。详细操作请参考保存Notebook镜像环境。图7 保存镜像查看所保存的镜像保存后的镜像可以在ModelArts控制台“镜像管理”页面查看到该镜像详情

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard开发环境
推理场景介绍 - AI开发平台ModelArts

保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。镜像版本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906）
查询算法列表 - AI开发平台ModelArts

算法版本数量，默认为0。 size Integer 算法大小。 create_time Long 算法创建时间戳。 update_time Long 算法更新时间戳。表6 job_config 参数参数类型描述 code_dir String 算法的代码目录。如：“/usr/app/”。应与boot_file一同出现。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
创建Workflow训练作业节点 - AI开发平台ModelArts

JobEngine(image_url="fake_image_url"), # 自定义镜像的url，格式为：组织名/镜像名称:版本号，不需要携带相应的域名地址；如果image_url需要设置为运行态可配置，则使用如下方式：image_url=wf.Placeholder(name="image_url"

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
推理场景介绍 - AI开发平台ModelArts

保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。镜像版本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907）
创建训练作业 - AI开发平台ModelArts

训练作业创建成功响应说明参数类型描述 TrainingJob Object 训练对象，该对象包含job_id等属性，对训练作业的查询、更新、删除等操作时，可通过job_instance.job_id获取训练作业ID。表7 调用训练接口失败响应参数参数类型描述 error_msg

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

til工具快速使用，将OBS桶中的数据下载至SFS Turbo中。注意：需要使用用户账号中的AK和SK进行签名验证，确保通过授权的账号才能访问指定的OBS资源。父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
推理场景介绍 - AI开发平台ModelArts

保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。镜像版本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908）
使用PyCharm ToolKit创建并调试训练作业 - AI开发平台ModelArts

|---log |---code 在PyCharm ToolKit工具中查看训练日志在PyCharm ToolKit工具中，单击页面右下角的ModelArts Training Log，展示训练日志。图7 查看训练日志父主题：创建调试训练作业

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 创建调试训练作业
启动推理服务 - AI开发平台ModelArts

E_DEVICES指定的可用卡数一致。 --address：头节点IP+端口号，头节点创建成功后，会有打印。环境变量每个节点都要设置。更新环境变量需要重启Ray集群。选择其中一个节点，添加指定分布式后端参数【--distributed-executor-backend=ra

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务部署
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

获取对应模型的权重文件，获取链接参考表1。权重文件下载有如下几种方式，但不仅限于以下方式：方法一：网页下载：通过单击表格中权重文件获取地址的访问链接，即可在模型主页的Files and Version中下载文件。方法二：huggingface-cli：huggingface-cli是

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
从0制作自定义镜像用于创建训练作业（MindSpore+Ascend） - AI开发平台ModelArts

ep-learning”，下面的命令中涉及到组织名称“deep-learning”也请替换为自定义的值。单击右上角“登录指令”，获取登录访问指令，本文选择复制临时登录指令。以root用户登录本地环境，输入复制的SWR临时登录指令。上传镜像至容器镜像服务镜像仓库。使用docker

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

权重文件存放目录。如果使用了量化功能，则使用推理模型量化章节转换后的权重。 --max-num-seqs：最大同时处理的请求数，超过后拒绝访问。 --max-model-len：推理时最大输入+最大输出tokens数量，输入超过该数量会直接返回。max-model-len的值必须小于config

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

batch中不同部分的数据。网络中相邻参数分桶，一般为神经网络模型中需要进行参数更新的每一层网络。每个进程前向传播并各自计算梯度。模型某一层的参数得到梯度后会马上进行通讯并进行梯度平均。各GPU更新模型参数。具体流程图如下：图1 多机多卡数据并行训练代码改造点引入多进程启动机制：初始化进程

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
在推理生产环境中部署推理服务 - AI开发平台ModelArts

单击“下一步”，再单击“提交”，开始部署服务，待服务状态显示“正常”服务部署完成。图4 服务部署完成 Step4 调用在线服务进入在线服务详情页面，选择“预测”，设置请求路径：“/generate”，输入预测代码“{"prompt": "你好", "temperature":0, "

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
推理场景介绍 - AI开发平台ModelArts

保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。镜像版本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909）
创建数据集导出任务 - AI开发平台ModelArts

task_id String 任务ID。 total_sample_count Integer 样本总数量。 update_time Long 任务更新时间。 version_format String 数据集版本格式。可选值如下： Default：默认格式 CarbonData：Carbon格式（仅表格数据集支持）

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询数据集的版本列表 - AI开发平台ModelArts

train_evaluate_sample_ratio String 发布版本时切分训练验证比例，默认为1.00，即全部分为训练集。 update_time Long 版本更新时间。 version_format String 数据集版本格式。可选值如下： Default：默认格式 CarbonData：Carbon格式（仅表格数据集支持）

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
PD分离部署使用说明 - AI开发平台ModelArts

table文件中各全量和增量节点顺序一致，否则会报错。确保scheduler实例和P、D实例之间网络通畅，检查代理设置例如no_proxy环境变量，避免scheduler访问P、D实例时走不必要的网关。前提条件已完成推理环境镜像制作，具体参见准备推理环境。步骤一：生成ranktable 介绍如何生成ran

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 分离部署
推理精度测试 - AI开发平台ModelArts

swag、Winogrande、TruthfulQA等，该工具为离线测评，不需要启动推理服务，目前支持大语言模型。约束限制确保容器可以访问公网。使用opencompass工具需用vllm接口启动在线服务。当前的精度测试仅适用于语言模型精度验证，不适用于多模态模型的精度验证

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910）

总条数： 1053

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用ModelArts VSCode插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

查询算法列表 - AI开发平台ModelArts

创建Workflow训练作业节点 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

使用PyCharm ToolKit创建并调试训练作业 - AI开发平台ModelArts

启动推理服务 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（MindSpore+Ascend） - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

创建数据集导出任务 - AI开发平台ModelArts

查询数据集的版本列表 - AI开发平台ModelArts

PD分离部署使用说明 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线