搜索_华为云

主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910）推理场景介绍部署推理服务推理性能测试推理精度测试推理模型量化 eagle投机小模型训练附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理常见问题父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
Lite Cluster资源开通 - AI开发平台ModelArts

污点：默认为空。支持给节点加污点来设置反亲和性，每个节点最多配置5条污点。安装后执行脚本：请输入脚本命令，命令中不能包含中文字符，需传入Base64转码后的脚本，转码后的字符数不能超过2048。脚本将在Kubernetes软件安装后执行，不影响Kubernetes软件安装。说明：暂不支持资源池中的存量节点池修改名称。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster）
查询Notebook支持的可切换规格列表 - AI开发平台ModelArts

Integer GPU卡数。 gpu_memory String GPU内存。 type String GPU类型。请求示例 GET https://{endpoint}/v1/{project_id}/notebooks/{id}/flavors 响应示例状态码：200 OK

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
管理Standard专属资源池 - AI开发平台ModelArts

修复Standard专属资源池故障节点修改Standard专属资源池支持的作业类型迁移Standard专属资源池和网络至其他工作空间配置Standard专属资源池可访问公网使用TMS标签实现资源分组管理管理Standard专属资源池的游离节点释放Standard专属资源池和删除网络

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理
AI Gallery（新版） - AI开发平台ModelArts

发布和管理AI Gallery中的AI应用使用AI Gallery微调大师训练模型使用AI Gallery在线推理服务部署模型 Gallery CLI配置工具指南计算规格说明

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery）
主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）推理场景介绍准备工作部署推理服务推理性能测试推理精度测试推理模型量化 eagle投机小模型训练附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理常见问题

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
创建训练任务 - AI开发平台ModelArts

k进行代码调试、使用Notebook进行代码调试相同）。创建训练任务登录ModelArts管理控制台，检查当前账号是否已完成访问授权的配置。如未完成，请参考使用委托授权。针对之前使用访问密钥授权的用户，建议清空授权，然后使用委托进行授权。在左侧导航栏中选择“模型训练 > 训练作业”，默认进入“训练作业”列表。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 多机多卡
历史待下线案例 - AI开发平台ModelArts

示例：从 0 到 1 制作自定义镜像并用于训练（MPI+CPU/GPU）使用ModelArts Standard一键完成商超商品识别模型部署专属资源池训练

 帮助中心 > AI开发平台ModelArts > 最佳实践
主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）推理场景介绍准备工作部署推理服务推理性能测试推理精度测试推理模型量化 Eagle投机小模型训练附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理常见问题

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
ModelArts计费模式概述 - AI开发平台ModelArts

Standard自动学习、Workflow、Notebook、模型训练、模型部署 Lite Cluster Lite Server Standard自动学习、Workflow、Notebook、模型训练、模型部署变更计费模式不支持支持变更为包年/包月计费模式。变更计费模式变更规格

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
查询超参搜索所有trial的结果 - AI开发平台ModelArts

如以下查询training_job_id为5b60a667-1438-4eb5-9705-85b860e623dc的作业的所有trial的信息。 GET https://endpoint/v2/{project_id}/training-jobs/5b60a667-1438-4eb5-9705-85

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
查询Workflow待办事项 - AI开发平台ModelArts

step_title String 节点的Title。 status String 状态。请求示例查看Workflow工作流的待办事项。 GET https://{endpoint}/v2/{project_id}/workflows/todolist?workspace_id=0 响应示例

 帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
资源池创建失败的原因与解决方法？ - AI开发平台ModelArts

用户可根据实际业务场景和节点规模，自定义配置容器网段，配置方式如下： ModelArts Standard池，资源池创建阶段指定容器网段，根据实际需要设置更大的容器网段。图7 设置容器网段 ModelArts Lite池，选择/创建具有更大容器网段的CCE集群。CCE容器网段配置参见网络规划。账号冻结导致创建失败？

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
SFT全参微调训练任务 - AI开发平台ModelArts

训练的数据集预处理说明。 Step2 修改训练超参配置以Llama2-70b和Llama2-13b的SFT微调为例，执行脚本为0_pl_sft_70b.sh 和 0_pl_sft_13b.sh 。修改模型训练脚本中的超参配置，必须修改的参数如表1所示。其他超参均有默认值，可以参考表1按照实际需求修改。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.905）
投机推理使用说明 - AI开发平台ModelArts

5倍的时间代价，生成了3倍的token数量，性能提升了100%。投机推理参数设置在启动离线或在线推理服务时参考表1所示配置参数，使用投机推理功能。表1 投机推理相关参数服务启动方式配置项取值类型配置说明 offline speculative_model str 小模型权重地址，目前支持相对基

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 投机推理
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

Turbo功能，则需要配置ModelArts和SFS Turbo间网络直通，以及配置ModelArts网络关联SFS Turbo。如果ModelArts网络关联SFS Turbo失败，则需要授权ModelArts云服务使用SFS Turbo，具体操作请参见配置ModelArts和SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.5.901） > 准备工作
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

Turbo功能，则需要配置ModelArts和SFS Turbo间网络直通，以及配置ModelArts网络关联SFS Turbo。如果ModelArts网络关联SFS Turbo失败，则需要授权ModelArts云服务使用SFS Turbo，具体操作请参见配置ModelArts和SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 准备工作
ModelArts CLI命令参考 - AI开发平台ModelArts

ModelArts CLI命令参考 ModelArts CLI命令功能介绍（可选）本地安装ma-cli ma-cli auto-completion自动补全命令 ma-cli configure鉴权命令 ma-cli image镜像构建支持的命令 ma-cli ma-job训练作业支持的命令

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
自动学习/Workflow计费项 - AI开发平台ModelArts

计算过程如下：创建自动学习项目时，无法直接选择专属资源池。可在项目创建成功后，进入自动学习详情页，然后单击右上角“配置”，在“Workflow配置 > 资源配置”中，选择使用专属资源池。存储费用：自动学习作业的数据通过对象存储服务（OBS）上传或导出，存储计费按照OBS的计费规则。

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
查询处理任务列表 - AI开发平台ModelArts

String 数据集的版本名称，名称仅包含数字、字母、中划线和下划线，长度是0-32位。请求示例查询某个数据集的特征分析任务历史列表 GET https://{endpoint}/v2/{project_id}/processor-tasks?offset=0&limit=10&sort

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）

总条数： 1864

上一页
1
...
78
79
80
...
94
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

Lite Cluster资源开通 - AI开发平台ModelArts

查询Notebook支持的可切换规格列表 - AI开发平台ModelArts

管理Standard专属资源池 - AI开发平台ModelArts

AI Gallery（新版） - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

创建训练任务 - AI开发平台ModelArts

历史待下线案例 - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

ModelArts计费模式概述 - AI开发平台ModelArts

查询超参搜索所有trial的结果 - AI开发平台ModelArts

查询Workflow待办事项 - AI开发平台ModelArts

资源池创建失败的原因与解决方法？ - AI开发平台ModelArts

SFT全参微调训练任务 - AI开发平台ModelArts

投机推理使用说明 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

ModelArts CLI命令参考 - AI开发平台ModelArts

自动学习/Workflow计费项 - AI开发平台ModelArts

查询处理任务列表 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线