搜索_华为云

使用kv-cache-int8量化 - AI开发平台ModelArts

Step2 抽取kv-cache量化系数该步骤的目的是将Step1使用tensorRT量化工具进行模型量化中生成的scale系数提取到单独文件中，供推理时使用。使用的抽取脚本由vllm社区提供： python3 examples/fp8/extract_scales.py \ --quantized_model

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
日志提示“CUDNN_STATUS_NOT_SUPPORTED. ” - AI开发平台ModelArts

3, 1, 2).contigous() 建议与总结在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直接使用线上notebook环境调试请参考使用JupyterLab开发模型。配置本地IDE（Pycharm或者VSCode）联接

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
如何关闭Mox的warmup - AI开发平台ModelArts

Tensorflow分布式有多种执行模式，mox会通过4次执行50 step记录执行时间，选择执行时间最少的模型。处理方法创建训练作业时，在“运行参数”中增加参数“variable_update=parameter_server”来关闭Mox的warmup。父主题： MoXing

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
模型适配 - AI开发平台ModelArts
模型适配 - AI开发平台ModelArts

--inputShape="input_ids:1,77" 在配置文件中指定输入shape。配置文件中通过“[ascend_context]”配置项指定input_shape，格式与命令行一致，多个输入，需要使用“;”隔开。然后在命令行中通过--configFile指定对应的配置文件路径即可。 # text_encoder

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 应用迁移
GPU裸金属服务器更换NVIDIA驱动后执行nvidia-smi提示Failed to initialize NVML - AI开发平台ModelArts

NVML: Driver/library version mismatch 处理方法执行命令：lsmod | grep nvidia，查看内核中是否残留旧版nvidia，显示如下： nvidia_uvm 634880 8 nvidia_drm

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
准备Notebook - AI开发平台ModelArts

snt9b，显存规格建议选择64G以上的规格，磁盘规格建议选择500GB及以上。创建完Notebook后，待Notebook状态变为“运行中”时，打开Notebook，可参考后续章节在Notebook调试环境中部署推理服务。父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911） > 准备工作
准备Notebook - AI开发平台ModelArts

snt9b，显存规格建议选择64G以上的规格，磁盘规格建议选择500GB及以上。创建完Notebook后，待Notebook状态变为“运行中”时，打开Notebook，可参考后续章节在Notebook调试环境中部署推理服务。父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） > 准备工作
Finetune训练 - AI开发平台ModelArts

Finetune训练服务使用ma-user用户执行如下命令运行训练脚本。 sh diffusers_sdxl_finetune_train.sh 训练执行脚本中配置了保存checkpoint的频率，每500steps保存一次，如果磁盘空间较小，这个值可以改大到5000，避免磁盘空间写满，导致训练失败终止。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
准备Notebook - AI开发平台ModelArts

snt9b，显存规格建议选择64G以上的规格，磁盘规格建议选择500GB及以上。创建完Notebook后，待Notebook状态变为“运行中”时，打开Notebook，可参考后续章节在Notebook调试环境中部署推理服务。父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 准备工作
准备Notebook - AI开发平台ModelArts

snt9b，显存规格建议选择64G以上的规格，磁盘规格建议选择500GB及以上。创建完Notebook后，待Notebook状态变为“运行中”时，打开Notebook，可参考后续章节在Notebook调试环境中部署推理服务。父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 准备工作
【下线公告】华为云ModelArts自动学习模块的文本分类功能下线公告 - AI开发平台ModelArts

本分类功能正式下线。下线范围下线Region：华为云全部Region。下线影响 ModelArts自动学习-文本分类正式下线后，所有用户将无法使用自动学习的文本分类功能创建项目，但仍可查看历史使用文本分类功能创建的作业。如您有任何问题，可随时通过工单或者服务热线（+86-

帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
删除训练作业 - AI开发平台ModelArts

jobs/{job_id} 参数说明如表1所示。表1 参数说明参数是否必选参数类型说明 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 job_id 是 Long 训练作业的ID。请求消息无请求参数。响应消息响应参数如表2所示。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
查询作业引擎规格 - AI开发平台ModelArts

/v1/{project_id}/job/ai-engines 参数说明如表1所示。表1 参数说明参数是否必选参数类型说明 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 查询检索参数说明参数是否为必选参数类型说明 job_type 否 String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 资源和引擎规格接口
安装ModelArts SDK报错“ERROR: Could not install packages due to an OSError” - AI开发平台ModelArts

'c:\python39\Scripts\ephemeral-port-reserve.exe.deleteme ”。原因分析用户使用权限问题导致。处理方法用户电脑切换到管理员角色，键盘快捷键（Windows+R模式）并输入cmd，进入黑色窗口，执行如下命令： python -m pip

帮助中心 > AI开发平台ModelArts > 故障排除 > API/SDK
更新训练作业描述 - AI开发平台ModelArts

jobs/{job_id} 参数说明如表1所示。表1 参数说明参数是否必选参数类型说明 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 job_id 是 Long 训练作业的ID。请求消息请求消息如表2所示。表2 请求参数

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
查询作业资源规格 - AI开发平台ModelArts

esource-specs 参数说明如表1所示。表1 参数说明参数是否必选参数类型说明 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 查询检索参数说明参数是否为必选参数类型说明 job_type 否 String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 资源和引擎规格接口
ModelArts自动学习与ModelArts PRO的区别是什么？ - AI开发平台ModelArts

用于图像分类、物体检测、预测分析、文本分类、声音分类等场景的模型。而ModelArts PRO是一款为企业级AI应用打造的专业开发套件。用户可根据预置工作流生成指定场景模型，无需深究底层模型开发细节。ModelArts PRO底层依托ModelArts平台提供数据标注、模型训练

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习
查询服务列表 - AI开发平台ModelArts

service_status 否 String 服务状态，默认不过滤服务状态。可根据服务状态查询，取值如下。 running：运行中，服务正常运行，正在计费。 deploying：部署中，服务正在部署，调度资源部署等。 concerning：告警，后端实例异常，可能正在计费。例如多实例的情况下，有

 帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
剪枝 - AI开发平台ModelArts
剪枝 - AI开发平台ModelArts

化稀疏剪枝、非结构化稀疏剪枝。 FASP剪枝 FASP剪枝是一种结构化稀疏剪枝方法，能有效降低模型显存以及需要部署的资源依赖，减小推理过程中的计算量，降低增量推理时延，提升吞吐。 FASP (Fast and Accurate Structured Pruning) 一种针对LL

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
使用SmoothQuant量化 - AI开发平台ModelArts

1”，以此类推。 export ASCEND_RT_VISIBLE_DEVICES=0,1 通过命令npu-smi info查询NPU卡为容器中的第几张卡。例如下图查询出两张卡，若希望使用第一和第二张卡，则“export ASCEND_RT_VISIBLE_DEVICES=0,1”，注意编号不是填4、5。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化

总条数： 2315

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用kv-cache-int8量化 - AI开发平台ModelArts

日志提示“CUDNN_STATUS_NOT_SUPPORTED. ” - AI开发平台ModelArts

如何关闭Mox的warmup - AI开发平台ModelArts

模型适配 - AI开发平台ModelArts

GPU裸金属服务器更换NVIDIA驱动后执行nvidia-smi提示Failed to initialize NVML - AI开发平台ModelArts

准备Notebook - AI开发平台ModelArts

准备Notebook - AI开发平台ModelArts

Finetune训练 - AI开发平台ModelArts

准备Notebook - AI开发平台ModelArts

准备Notebook - AI开发平台ModelArts

【下线公告】华为云ModelArts自动学习模块的文本分类功能下线公告 - AI开发平台ModelArts

删除训练作业 - AI开发平台ModelArts

查询作业引擎规格 - AI开发平台ModelArts

安装ModelArts SDK报错“ERROR: Could not install packages due to an OSError” - AI开发平台ModelArts

更新训练作业描述 - AI开发平台ModelArts

查询作业资源规格 - AI开发平台ModelArts

ModelArts自动学习与ModelArts PRO的区别是什么？ - AI开发平台ModelArts

查询服务列表 - AI开发平台ModelArts

剪枝 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线