搜索_华为云

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

=0,1 通过命令npu-smi info查询NPU卡为容器中的第几张卡。例如下图查询出两张卡，如果希望使用第一和第二张卡，则“export ASCEND_RT_VISIBLE_DEVICES=0,1”，注意编号不是填4、5。图2 查询结果配置环境变量。 export DEFER_DECODE=1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
Standard开发环境 - AI开发平台ModelArts

JupyterLab是一个交互式的开发环境，是Jupyter Notebook的下一代产品，可以使用它编写Notebook、操作终端、编辑MarkDown文本、打开交互模式、查看csv文件及图片等功能。父主题： Standard功能介绍

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

升级为WebSocket：打开开关图2 升级为WebSocket 单击“下一步”，确认配置后“提交”，完成在线服务的部署。返回在线服务列表页，查看服务状态变为“运行中”，表示服务部署成功。 WebSocket在线服务调用 WebSocket协议本身不提供额外的认证方式。不管自定义镜像

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
部署模型为在线服务 - AI开发平台ModelArts

日志”支持简单查询。如果开启此功能，在线服务的运行日志会输出存放到云日志服务LTS。LTS自动创建日志组和日志流，默认缓存7天内的运行日志。如需了解LTS专业日志管理功能，请参见云日志服务。说明： “运行日志输出”开启后，不支持关闭。 LTS服务提供的日志查询和日志存储功能涉

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
创建数据集 - AI开发平台ModelArts

String MRS集群ID。可登录MRS控制台查看。 cluster_mode 否 String MRS集群运行模式。可选值如下： 0：普通集群 1：安全集群 cluster_name 否 String MRS集群名称。可登录MRS控制台查看。 database_name 否 String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
创建数据集导出任务 - AI开发平台ModelArts

day：搜索昨天(往前1天)至今天内添加的样本 yyyyMMdd-yyyyMMdd：搜索指定时间段内添加的样本，格式为“起始日期-结束日期”，查询天数不能超过30天。例如：“20190901-2019091501”表示搜索2019年9月1日至2019年9月15日期间的样本。 score

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
创建训练作业 - AI开发平台ModelArts

描述 key_pair_names 否 Array of strings SSH密钥对名称，可以在云服务器控制台（ECS）“密钥对”页面创建和查看。响应参数状态码： 201 表50 响应Body参数参数参数类型描述 kind String 训练作业类型。默认使用job。枚举值：

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

=0,1 通过命令npu-smi info查询NPU卡为容器中的第几张卡。例如下图查询出两张卡，如果希望使用第一和第二张卡，则“export ASCEND_RT_VISIBLE_DEVICES=0,1”，注意编号不是填4、5。图2 查询结果配置环境变量。 export DEFER_DECODE=1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
上传算法至SFS - AI开发平台ModelArts

”、“VC_TASK_INDEX”、“MA_NUM_GPUS”为ModelArts训练容器中预置的环境变量。训练容器环境变量详细介绍可参考查看训练容器环境变量。通过obsutils，将代码文件夹放到OBS上，然后通过OBS将代码传至SFS相应目录中。在SFS中将代码文件Swi

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 多机多卡
创建资源池 - AI开发平台ModelArts

是 String 用户指定的资源池名称。 os.modelarts/workspace.id 否 String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。 os.modelarts/node.prefix

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
模型推理代码编写说明 - AI开发平台ModelArts

当前推理基础镜像使用的python的logging模块，采用的是默认的日志级别Warning，即当前只有warning级别的日志可以默认查询出来。如果想要指定INFO等级的日志能够查询出来，需要在代码中指定logging的输出日志等级为INFO级别。 1 2 3 4 5 6

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
更新服务配置 - AI开发平台ModelArts

String> 公共参数。运行模型需要的环境变量键值对，可选填，默认为空。 specification 是 String 公共参数。资源规格，可通过查询支持的服务部署规格可获取规格列表。当前版本可选modelarts.vm.cpu.2u/modelarts.vm.gpu.pnt004(需申请)/modelarts

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
终止训练作业 - AI开发平台ModelArts

String 用户项目ID。获取方法请参见获取项目ID和名称。 training_job_id 是 String 训练作业ID。获取方法请参见查询训练作业列表。请求参数表2 请求Body参数参数是否必选参数类型描述 action_type 是 String 对训练作业的操

 帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

准备训练模型适用的容器镜像。训练启动训练介绍各个训练阶段：指令微调、PPO强化训练、RM奖励模型、DPO偏好训练使用全参/lora训练策略进行训练任务、性能查看。父主题：主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909）
调用MaaS部署的模型服务 - AI开发平台ModelArts

在“鉴权管理”页面，单击“创建API Key”，填写描述信息后，单击“确认”会返回“您的密钥”，请复制保存密钥，单击“关闭”后将无法再次查看密钥。最多支持创建5个密钥，密钥只会在新建后显示一次，请妥善保存。当密钥丢失将无法找回，请新建API Key获取新的访问密钥。步骤2：调用MaaS模型服务进行预测

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
从容器镜像中导入模型文件创建模型 - AI开发平台ModelArts

写说明中的apis参数说明，示例代码请参见apis参数代码示例。确认信息填写无误，单击“立即创建”，完成模型创建。在模型列表中，您可以查看刚创建的模型及其对应的版本。当模型状态变更为“正常”时，表示模型创建成功。在此页面，您还可以进行创建新版本、快速部署服务、发布模型等操作。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

准备训练模型适用的容器镜像。训练启动训练介绍各个训练阶段：指令微调、PPO强化训练、RM奖励模型、DPO偏好训练使用全参/lora训练策略进行训练任务、性能查看。父主题：主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910）
yaml配置文件参数配置说明 - AI开发平台ModelArts

用于指定预处理数据的工作线程数。随着线程数的增加，预处理的速度也会提高，但也会增加内存的使用。 per_device_train_batch_size 1 必须修改，指定每个设备的训练批次大小。 gradient_accumulation_steps 8 指定梯度累积的步数,这可以增加批次大小而不增加内存消耗。 output_dir

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 训练脚本说明
终止训练作业 - AI开发平台ModelArts

会话对象，初始化方法请参考Session鉴权。 job_id 是 String 训练作业的id，可通过创建训练作业生成的训练作业对象查询，如"job_instance.job_id"，或从查询训练作业列表的响应中获得。表2 返回参数说明参数参数类型描述 kind String 训练作业类型。默认使用job。

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
预置框架启动文件的启动流程说明 - AI开发平台ModelArts

如果在torchrun初始化分布式一致性协商阶段出现“RuntimeError：Socket Timeout”错误时，可以通过增加如下环境变量再次创建训练作业以查看torchrun初始化阶段的详细信息，进一步排查问题。 LOGLEVEL=INFO TORCH_CPP_LOG_LEVEL=INFO TO

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码

总条数： 1588

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

Standard开发环境 - AI开发平台ModelArts

ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

部署模型为在线服务 - AI开发平台ModelArts

创建数据集 - AI开发平台ModelArts

创建数据集导出任务 - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

上传算法至SFS - AI开发平台ModelArts

创建资源池 - AI开发平台ModelArts

模型推理代码编写说明 - AI开发平台ModelArts

更新服务配置 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

调用MaaS部署的模型服务 - AI开发平台ModelArts

从容器镜像中导入模型文件创建模型 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

yaml配置文件参数配置说明 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

预置框架启动文件的启动流程说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线