搜索_华为云

图模式 - AI开发平台ModelArts
图模式 - AI开发平台ModelArts

开启图模式后，服务第一次响应请求时会有一个较长时间的图编译过程，并且会在当前目录下生成.torchair_cache文件夹来保存图编译的缓存文件。当服务第二次启动时，可通过缓存文件来快速完成图编译的过程，避免长时间的等待，并且基于图编译缓存文件来启动服务可获得更优的推理性能，因此请在有图编译缓存文件的前提下启动服务

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
AI开发基本概念 - AI开发平台ModelArts

AI开发基本概念机器学习常见的分类有3种：监督学习：利用一组已知类别的样本调整分类器的参数，使其达到所要求性能的过程，也称为监督训练或有教师学习。常见的有回归和分类。非监督学习：在未加标签的数据中，试图找到隐藏的结构。常见的有聚类。强化学习：智能系统从环境到行为映射的学习，以使奖励信号（强化信号）函数值最大。

帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
推理精度测试 - AI开发平台ModelArts

opencompass也支持通过本地权重来进行ppl精度测试。本质上使用transformers进行推理，因为没有框架的优化，执行时间最长。另一方面，由于是使用transformers推理，结果也是最稳定的。对单卡运行的模型比较友好，算力利用率比较高。对多卡运行的推理，缺少负载均衡，利用率低。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908）
安装ModelArts SDK报错“ERROR: Could not install packages due to an OSError” - AI开发平台ModelArts

'c:\python39\Scripts\ephemeral-port-reserve.exe.deleteme ”。原因分析用户使用权限问题导致。处理方法用户电脑切换到管理员角色，键盘快捷键（Windows+R模式）并输入cmd，进入黑色窗口，执行如下命令： python -m pip install --upgrade

帮助中心 > AI开发平台ModelArts > 故障排除 > API/SDK
GPU裸金属服务器使用EulerOS内核误升级如何解决 - AI开发平台ModelArts

rOS 2.9(基于CentOS制作的Linux发行版)，经常遇到服务器重启后，操作系统内核无故升级，导致系统上原安装的nvidia-driver等软件无法使用，只能卸载重新安装。原因分析分析EulerOS内核是如何在不知情的情况下升级的：首先查看当前操作系统内核。 [root@Server-ddff

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
批量服务输入/输出obs目录不存在或者权限不足 - AI开发平台ModelArts

提工单申请技术支持 ModelArts.3567：用户只能访问自己账号下的obs目录，ModelArts在读取其他用户obs下的数据时，需要用户委托权限，没有创建委托，就没有权限使用其他用户obs中的数据。登录ModelArts控制台，管理控制台，在左侧导航栏中选择“权限管理”

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
推理精度测试 - AI开发平台ModelArts

opencompass也支持通过本地权重来进行ppl精度测试。本质上使用transformers进行推理，因为没有框架的优化，执行时间最长。另一方面，由于是使用transformers推理，结果也是最稳定的。对单卡运行的模型比较友好，算力利用率比较高。对多卡运行的推理，缺少负载均衡，利用率低。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907）
训练作业找不到GPU - AI开发平台ModelArts

下配置，设置该程序可见的GPU： os.environ['CUDA_VISIBLE_DEVICES'] = '0,1,2,3,4,5,6,7' 其中，0为服务器的GPU编号，可以为0，1，2，3等，表明对程序可见的GPU编号。如果未进行添加配置则该编号对应的GPU不可用。父主题：

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
执行训练任务 - AI开发平台ModelArts

DPO偏好训练、Reward奖励模型训练、PPO强化学习目前仅限制支持llama3系列。 PPO训练暂不支持llama3-70B，存在已知的内存OOM问题，待社区版本修复。训练策略类型全参full，配置如下： finetuning_type: full lora，如dpo仅支持此策略；配置如下： finetuning_type:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911）
释放Lite Cluster资源 - AI开发平台ModelArts

点的资源释放。支持批量退订节点。如果是“包年/包月”且资源到期的节点（处于宽限期），您可单击操作列的“释放”，即可实现对单个节点的资源释放。不支持批量释放处于宽限期的节点。退订/释放操作无法恢复，请谨慎操作。父主题： Lite Cluster资源管理

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
执行训练任务 - AI开发平台ModelArts

PPO强化学习目前仅限制支持于llama3系列 2、PPO训练暂不支持 ZeRO-3存在通信问题，如llama3-70B使用ZeRO-3暂不支持训练策略类型全参full，配置如下： finetuning_type: full lora，如dpo仅支持此策略；配置如下： finetuning_type:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909）
Prefix Caching - AI开发平台ModelArts

在LLM推理应用中，经常会面临具有长system prompt的场景以及多轮对话的场景。长system prompt的场景，system prompt在不同的请求中但是相同的，KV Cache的计算也是相同的；多轮对话场景中，每一轮对话需要依赖所有历史轮次对话的上下文，历史轮次中的KV Cache在后续每一轮中

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
Lite Server - AI开发平台ModelArts
Lite Server - AI开发平台ModelArts

04内核自动升级？哪里可以了解Atlas800训练服务器硬件相关内容使用GPU A系列裸金属服务器有哪些注意事项？ GPU A系列裸金属服务器如何更换NVIDIA和CUDA？

帮助中心 > AI开发平台ModelArts > 常见问题
推理精度测试 - AI开发平台ModelArts

opencompass也支持通过本地权重来进行ppl精度测试。本质上使用transformers进行推理，因为没有框架的优化，执行时间最长。另一方面，由于是使用transformers推理，结果也是最稳定的。对单卡运行的模型比较友好，算力利用率比较高。对多卡运行的推理，缺少负载均衡，利用率低。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
使用CTS审计ModelArts服务 - AI开发平台ModelArts

使用CTS审计ModelArts服务 ModelArts支持云审计的关键操作查看ModelArts相关审计日志

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
通过Function Calling扩展大语言模型交互能力 - AI开发平台ModelArts

Calling扩展大语言模型交互能力 Function Calling介绍在Dify中配置支持Function Calling的模型使用通过Function Calling扩展大语言模型对外部环境的理解

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
API/SDK - AI开发平台ModelArts
API/SDK - AI开发平台ModelArts

SDK、OBS SDK和MoXing的区别是什么？ ModelArts的API或SDK支持模型下载到本地吗？ ModelArts通过OBS的API访问OBS中的文件，属于内网还是公网访问？调用ModelArts API接口创建训练作业和部署服务时，如何填写资源池的参数？

帮助中心 > AI开发平台ModelArts > 常见问题
管理开发环境实例 - AI开发平台ModelArts

参数是否必选参数类型说明。 action 是 String 操作开发环境实例，支持： start stop restart queue dequeue 其中，queue和dequeue仅支持对免费资源进行操作。响应消息响应参数如表3所示。表3 响应参数参数参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
附录 - AI开发平台ModelArts
附录 - AI开发平台ModelArts

附录各模型支持的最小卡数和最大序列 Ascend-vLLM推理常见问题父主题：主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
Standard功能介绍 - AI开发平台ModelArts

Standard数据管理 Standard开发环境 Standard模型训练 Standard模型部署 Standard资源管理 Standard支持的AI框架父主题：功能介绍

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍

总条数： 1682

上一页
1
...
75
76
77
...
85
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

图模式 - AI开发平台ModelArts

AI开发基本概念 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

安装ModelArts SDK报错“ERROR: Could not install packages due to an OSError” - AI开发平台ModelArts

GPU裸金属服务器使用EulerOS内核误升级如何解决 - AI开发平台ModelArts

批量服务输入/输出obs目录不存在或者权限不足 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

训练作业找不到GPU - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

释放Lite Cluster资源 - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

Prefix Caching - AI开发平台ModelArts

Lite Server - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

使用CTS审计ModelArts服务 - AI开发平台ModelArts

通过Function Calling扩展大语言模型交互能力 - AI开发平台ModelArts

API/SDK - AI开发平台ModelArts

管理开发环境实例 - AI开发平台ModelArts

附录 - AI开发平台ModelArts

Standard功能介绍 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线