搜索_华为云

部署推理服务 - AI开发平台ModelArts

部署推理服务非分离部署推理服务分离部署推理服务父主题：主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910）
部署推理服务 - AI开发平台ModelArts

部署推理服务非分离部署推理服务分离部署推理服务父主题：主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
管理Standard专属资源池 - AI开发平台ModelArts

修复Standard专属资源池故障节点修改Standard专属资源池支持的作业类型迁移Standard专属资源池和网络至其他工作空间配置Standard专属资源池可访问公网使用TMS标签实现资源分组管理管理Standard专属资源池的游离节点释放Standard专属资源池和删除网络

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理
创建训练任务 - AI开发平台ModelArts

k进行代码调试、使用Notebook进行代码调试相同）。创建训练任务登录ModelArts管理控制台，检查当前账号是否已完成访问授权的配置。如未完成，请参考使用委托授权。针对之前使用访问密钥授权的用户，建议清空授权，然后使用委托进行授权。在左侧导航栏中选择“模型训练 > 训练作业”，默认进入“训练作业”列表。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 多机多卡
访问在线服务支持的访问通道 - AI开发平台ModelArts

访问在线服务支持的访问通道通过公网访问通道的方式访问在线服务通过VPC访问通道的方式访问在线服务通过VPC高速访问通道的方式访问在线服务父主题：将模型部署为实时推理作业

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
访问在线服务支持的传输协议 - AI开发平台ModelArts

访问在线服务支持的传输协议使用WebSocket协议的方式访问在线服务使用Server-Sent Events协议的方式访问在线服务父主题：将模型部署为实时推理作业

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
SFT全参微调训练任务 - AI开发平台ModelArts

训练的数据集预处理说明。 Step2 修改训练超参配置以Llama2-70b和Llama2-13b的SFT微调为例，执行脚本为0_pl_sft_70b.sh 和 0_pl_sft_13b.sh 。修改模型训练脚本中的超参配置，必须修改的参数如表1所示。其他超参均有默认值，可以参考表1按照实际需求修改。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905）
准备数据（可选） - AI开发平台ModelArts

更新代码目录下data/dataset_info.json文件。如使用以下示例数据集则命令如下。关于数据集文件格式及配置，更多样例格式信息请参考README_zh.md 的内容。 vim dataset_info.json 新加配置参数如下： "alpaca_gpt4_data": { "file_name":

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 准备工作
创建开发环境实例 - AI开发平台ModelArts

provision Object 部署信息，如表13所示。 labels Map<String,String> 配置标签。表13 provision字段数据结构说明参数参数类型说明 type String 部署类型，当前仅支持Docker。 spec Object 部署详情，如表14所示。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
投机推理使用说明 - AI开发平台ModelArts

5倍的时间代价，生成了3倍的token数量，性能提升了100%。投机推理参数设置在启动离线或在线推理服务时参考表1所示配置参数，使用投机推理功能。表1 投机推理相关参数服务启动方式配置项取值类型配置说明 offline speculative_model str 小模型权重地址，目前支持相对基

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 投机推理
查询训练作业详情 - AI开发平台ModelArts

n_id+item_version_id则无需填写。 autosearch_config_path String 自动化搜索作业的yaml配置路径，需要提供一个OBS路径。 autosearch_framework_path String 自动化搜索作业的框架代码目录，需要提供一个OBS路径。

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
LoRA微调训练 - AI开发平台ModelArts

训练的数据集预处理说明。 Step2 修改训练超参配置以Llama2-70b和Llama2-13b的LoRA微调为例，执行脚本为0_pl_lora_70b.sh和0_pl_lora_13b.sh 。修改模型训练脚本中的超参配置，必须修改的参数如表1所示。其他超参均有默认值，可以参考表1按照实际需求修改。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905）
精度问题概述 - AI开发平台ModelArts

验证准确度与CPU/GPU差异不符合预期。在迁移到NPU环境下训练发现以上问题时，说明精度可能存在偏差，需要进一步做精度调优。下文将分别阐述精度诊断的整体思路和如何借助精度工具进行精度问题的定位。父主题： PyTorch迁移精度调优

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
访问在线服务支持的认证方式 - AI开发平台ModelArts

访问在线服务支持的认证方式通过Token认证的方式访问在线服务通过AK/SK认证的方式访问在线服务通过APP认证的方式访问在线服务父主题：将模型部署为实时推理作业

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
终止训练作业 - AI开发平台ModelArts

n_id+item_version_id则无需填写。 autosearch_config_path String 自动化搜索作业的yaml配置路径，需要提供一个OBS路径。 autosearch_framework_path String 自动化搜索作业的框架代码目录，需要提供一个OBS路径。

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
查询样本列表 - AI开发平台ModelArts

1：文本 2：音频 4：表格 6：视频 9：自由格式（默认值） search_conditions 否 String URL编码后的多维筛选条件（多个SearchCondition之间为and的关系）。 version_id 否 String 数据集版本ID。请求参数无响应参数状态码：

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
分页查询团队标注任务下的样本列表 - AI开发平台ModelArts

已驳回 __AUTO_ANNOTATION__：待确认 search_conditions 否 String URL编码后的多维筛选条件（多个SearchCondition之间为and的关系）。请求参数无响应参数状态码： 200 表3 响应Body参数参数参数类型描述

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
SFT全参微调训练任务 - AI开发平台ModelArts

明和训练的数据集预处理说明。步骤2 修改训练超参配置以Llama2-70b和Llama2-13b的SFT微调为例，执行脚本为0_pl_sft_70b.sh 和 0_pl_sft_13b.sh 。修改模型训练脚本中的超参配置，必须修改的参数如表1所示。其他超参均有默认值，可以参考表1按照实际需求修改。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906）
VS Code连接Notebook方式介绍 - AI开发平台ModelArts

VS Code安装指导如下：图2 Windows系统下VS Code安装指导 Linux系统下，执行命令sudo dpkg -i code_1.85.2-1705561292_amd64.deb安装。 Linux系统用户，需要在非root用户进行VS Code安装。父主题：通过VS

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
NPU日志收集上传 - AI开发平台ModelArts

准备租户名ID和IAM用户名ID，用于OBS桶配置。将您的租户名ID和IAM用户名ID提供给华为技术支持，华为云技术支持将根据您提供的信息，为您配置OBS桶策略，以便用户收集的日志可以上传至对应的OBS桶。华为云技术支持配置完成后，会给您提供对应的OBS桶目录“obs_dir”，该目录用于后续配置的脚本中。图2

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理

总条数： 1941

上一页
1
...
75
76
77
...
98
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

部署推理服务 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

管理Standard专属资源池 - AI开发平台ModelArts

创建训练任务 - AI开发平台ModelArts

访问在线服务支持的访问通道 - AI开发平台ModelArts

访问在线服务支持的传输协议 - AI开发平台ModelArts

SFT全参微调训练任务 - AI开发平台ModelArts

准备数据（可选） - AI开发平台ModelArts

创建开发环境实例 - AI开发平台ModelArts

投机推理使用说明 - AI开发平台ModelArts

查询训练作业详情 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

精度问题概述 - AI开发平台ModelArts

访问在线服务支持的认证方式 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

查询样本列表 - AI开发平台ModelArts

分页查询团队标注任务下的样本列表 - AI开发平台ModelArts

SFT全参微调训练任务 - AI开发平台ModelArts

VS Code连接Notebook方式介绍 - AI开发平台ModelArts

NPU日志收集上传 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线