搜索_华为云

工具介绍及准备工作 - AI开发平台ModelArts

、性能对比、下游任务评测、loss和下游任务对比能力。对比结果以excel文件呈现。方便用户验证发布模型的质量。所有配置都通过yaml文件设置，用户查看默认yaml文件即可知道最优性能的配置。目前仅支持SFT指令监督微调训练阶段。代码目录 benchmark工具脚本存放在代码

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练benchmark工具
Lite Server高危操作一览表 - AI开发平台ModelArts

本功能不可用。相关高危命令如：apt-get upgrade。高如果需要升级/修改，请联系华为云技术支持。切换或者重置操作系统。服务器在进行过“切换或者重置操作系统”操作后，EVS系统盘ID发生变化，和下单时订单中的EVS ID已经不一致，因此EVS系统盘将不支持扩容，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server使用前必读
升级模型服务 - AI开发平台ModelArts

在“模型部署”页面，单击“我的服务”页签。在目标模型服务右侧，单击操作列的“更多 > 服务升级”。在“服务升级”页面，配置升级参数。 “模型设置”：选择原模型下的其他模型版本。其他参数不可修改，但可以了解原模型服务的配置。配置完成后，单击“提交”启动服务升级。父主题：管理我的服务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 管理我的服务
创建资源池 - AI开发平台ModelArts

error_code String ModelArts错误码。 error_msg String 具体错误信息。请求示例创建专属资源池。设置资源类型为“Pool”，资源池名称为“pool-001”，资源池类型为“Dedicate”（物理资源池），资源池支持的作业类型为“训练作业”。

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
如何通过docker镜像启动容器？ - AI开发平台ModelArts

预置，在本地环境通过docker run启动通过Notebook保存的镜像，报错创建容器任务失败，启动文件或目录不存在，如图2。因此需要设置--entrypoint参数，覆盖Entrypoint中指定的程序。使用--entrypoint参数指定的启动文件或命令启动镜像。命令示例如下：

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard镜像相关
新建Workflow工作流 - AI开发平台ModelArts

WorkflowStorage objects Workflow包含的统一存储定义。 labels 否 Array of strings 为Workflow工作流设置的标签。 assets 否 Array of WorkflowAsset objects 工作流绑定的资产。 sub_graphs 否 Array

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
安全边界 - AI开发平台ModelArts
安全边界 - AI开发平台ModelArts

进行适当的访问控制，以确保只有授权用户可以访问管理在线服务等相关资源。监控和报告任何异常活动，并及时采取措施。推理部署安全责任提供商底层ecs相关的系统补丁修复 k8s的版本更新和漏洞修复虚拟机OS的版本生命周期维护 ModelArts推理平台自身的安全合规性容器应用服务加固模型运行环境的版本更新和漏洞定期修复

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
非分离部署推理服务 - AI开发平台ModelArts

16,32 # 设置动态分档的档位，根据实际情况设置，另外请不要设置档位1(DeepSeek V2 236B W8A8 模型建议最大设置4个档位) export VLLM_ENGINE_ITERATION_TIMEOUT_S=1500 # 设置vllm请求超时时间(DeepSeek

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
训练迁移快速入门案例 - AI开发平台ModelArts

包，具有root权限，结合配置指导、初始化工具及容器镜像可以快速搭建昇腾开发环境。开通裸金属服务器资源请参见DevServer资源开通，在裸金属服务器上搭建迁移环境请参见裸金属服务器环境配置指导，使用ModelArts提供的基础容器镜像请参见容器环境搭建。训练代码迁移前提条件

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
MindSpore Lite问题定位指南 - AI开发平台ModelArts

Studio报错、使用Xcode构建APP报错等，您可以先查看日志信息进行定位分析。多数场景下的问题可以通过日志报错信息直接定位。如果日志的信息不能定位问题，您可以通过设置环境变量调整日志等级，打印更多调试日志。关于如何对MindSpore Lite遇到的问题进行定位与解决，请参见MindSpore Lite官网提供的问题定位指南。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 常见问题
SDK简介 - AI开发平台ModelArts
SDK简介 - AI开发平台ModelArts

ModelArts SDK支持在本地安装配置使用。使用时，需进行Session鉴权。本地安装SDK。如果本地未安装SDK，可参考（可选）本地服务器安装ModelArts SDK安装；如果本地已安装，则无需再次安装。进行Session鉴权。可参见（可选）Session鉴权完成鉴权。鉴权完成后，即可开始使用。

帮助中心 > AI开发平台ModelArts > SDK参考
部署服务 - AI开发平台ModelArts
部署服务 - AI开发平台ModelArts

hcs) priority 否 Integer 抢占优先级，取值范围[1, 3]，通过设置优先级保障高优先级的业务调度。infer_type为real-time、batch时支持抢占优先级设置。表4 Schedule 参数是否必选参数类型描述 duration 是 Integer

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
非分离部署推理服务 - AI开发平台ModelArts

16,32 # 设置动态分档的档位，根据实际情况设置，另外请不要设置档位1(DeepSeek V2 236B W8A8 模型建议最大设置4个档位) export VLLM_ENGINE_ITERATION_TIMEOUT_S=1500 # 设置vllm请求超时时间(DeepSeek

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 部署推理服务
场景介绍及环境准备 - AI开发平台ModelArts

DevServer 该环境为裸机开发环境，主要面向深度定制化开发场景。环境开通指导请参考DevServer资源开通；环境配置指导请参考Snt9B裸金属服务器环境配置指南。本文基于ModelArts Lite DevServer进行操作，请参考上表说明在贵阳一环境开通和配置指导完成裸机和容器开发初始化配置。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型PyTorch迁移与精度性能调优
ModelArts计费模式概述 - AI开发平台ModelArts

表1列出了两种计费模式的区别。表1 计费模式计费模式包年/包月按需计费付费方式预付费按照订单的购买周期结算。后付费按照云服务器实际使用时长计费。计费周期按订单的购买周期计费。秒级计费，按小时结算。适用计费项计算资源计算资源、云硬盘适用资源池专属资源池

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
日志提示“cuda runtime error (10) : invalid device ordinal at xxx” - AI开发平台ModelArts

请检查CUDA_VISIBLE_DEVICES设置的值是否与作业规格匹配。例如您选择4卡规格的作业，实际可用的卡ID为0、1、2、3，但是您在进行cuda相关的运算时，例如"tensor.to(device="cuda:7")"，将张量搬到了7号GPU卡上，超过了实际可用的ID号。如果cuda相关运算设置的卡ID号

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
管理训练容器环境变量 - AI开发平台ModelArts

API网关地址环境变量作业元信息环境变量约束限制为了避免新设置的环境变量与系统环境变量冲突，而引起作业运行异常或失败，请在定义自定义环境变量时，不要使用“MA_”开头的名称。如何修改环境变量用户可以在创建训练作业页面增加新的环境变量，也可以设置新的取值覆盖当前训练容器中预置的环境变量值。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

Standard，用户需要购买专属资源池，具体步骤请参考创建资源池。资源规格要求：计算规格：不同模型训练推荐的NPU卡数请参见不同模型推荐的参数与NPU卡数设置。硬盘空间：至少200GB。昇腾资源规格： Ascend: 1*ascend-snt9b表示昇腾单卡。 Ascend: 8*ascend-snt9b表示昇腾8卡。

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 准备工作
部署在线服务 - AI开发平台ModelArts

[Schedule(op_type='stop', time_unit='HOURS', duration=1)] # （可选）设置在线服务运行时间 ) 参数“model_id”代表将部署成在线服务的模型。“model_id”可以通过查询模型列表或者ModelArts管理控制台获取。

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
部署预测分析服务 - AI开发平台ModelArts

5之间的整数。是否自动停止：启用该参数并设置时间后，服务将在指定时间后自动停止。如果不启用此参数，在线服务将一直运行，同时一直收费，自动停止功能可以帮您避免产生不必要的费用。默认开启自动停止功能，且默认值为“1小时后”。目前支持设置为“1小时后”、“2小时后”、“4小时后”、

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现预测分析

总条数： 1947

上一页
1
...
14
15
16
...
98
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

工具介绍及准备工作 - AI开发平台ModelArts

Lite Server高危操作一览表 - AI开发平台ModelArts

升级模型服务 - AI开发平台ModelArts

创建资源池 - AI开发平台ModelArts

如何通过docker镜像启动容器？ - AI开发平台ModelArts

新建Workflow工作流 - AI开发平台ModelArts

安全边界 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

训练迁移快速入门案例 - AI开发平台ModelArts

MindSpore Lite问题定位指南 - AI开发平台ModelArts

SDK简介 - AI开发平台ModelArts

部署服务 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

场景介绍及环境准备 - AI开发平台ModelArts

ModelArts计费模式概述 - AI开发平台ModelArts

日志提示“cuda runtime error (10) : invalid device ordinal at xxx” - AI开发平台ModelArts

管理训练容器环境变量 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

部署在线服务 - AI开发平台ModelArts

部署预测分析服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线