搜索_华为云

使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

使用SmoothQuant量化工具转换权重 SmoothQuant(W8A8)量化方案能降低模型显存以及需要部署的卡数。也能同时降低首token时延和增量推理时延。支持SmoothQuant(W8A8)量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何在Noteboo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
Eagle投机小模型训练 - AI开发平台ModelArts

bash build.sh 步骤二：非sharegpt格式数据集转换（可选）如果数据集json文件不是sharegpt格式，而是常见的如下格式，则需要执行convert_to_sharegpt.py 文件将数据集转换为share gpt格式。 { "prefix": "AAA"

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
Eagle投机小模型训练 - AI开发平台ModelArts

bash build.sh 步骤二：非sharegpt格式数据集转换（可选）如果数据集json文件不是sharegpt格式，而是常见的如下格式，则需要执行convert_to_sharegpt.py 文件将数据集转换为share gpt格式。 { "prefix": "AAA"

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
Eagle投机小模型训练 - AI开发平台ModelArts

bash build.sh 步骤二：非sharegpt格式数据集转换（可选）如果数据集json文件不是sharegpt格式，而是常见的如下格式，则需要执行convert_to_sharegpt.py 文件将数据集转换为share gpt格式。 { "prefix": "AAA"

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
启动推理服务 - AI开发平台ModelArts

式是HuggingFace的目录格式。即上传的HuggingFace权重文件存放目录。如果使用了量化功能，则使用量化章节转换后的权重。如果使用的是训练后模型转换为HuggingFace格式的地址，还需要有Tokenizer原始文件。 --max-num-seqs：最大同时处理的请求数，超过后在等待池等候处理。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务部署
管理AI Gallery镜像 - AI开发平台ModelArts

编辑完成后，单击“确认”保存修改。管理镜像文件预览文件在镜像详情页，选择“镜像文件”页签。单击文件名称即可在线预览文件内容。仅支持预览大小不超过10MB、格式为文本类或图片类的文件。下载文件在镜像详情页，选择“镜像文件”页签。单击操作列的“下载”，选择保存路径单击“确认”，即可下载文件到本地。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery镜像
自动学习训练后的模型是否可以下载？ - AI开发平台ModelArts

自动学习训练后的模型是否可以下载？不可以下载。但是您可以在AI应用管理页面查看，或者将此模型部署为在线服务。父主题： Standard自动学习

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习
使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

使用SmoothQuant量化工具转换权重 SmoothQuant(W8A8)量化方案能降低模型显存以及需要部署的卡数。也能同时降低首token时延和增量推理时延。支持SmoothQuant(W8A8)量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何在Noteboo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

使用SmoothQuant量化工具转换权重 SmoothQuant(W8A8)量化方案能降低模型显存以及需要部署的卡数。也能同时降低首token时延和增量推理时延。支持SmoothQuant(W8A8)量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何在Noteboo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

使用SmoothQuant量化工具转换权重 SmoothQuant(W8A8)量化方案能降低模型显存以及需要部署的卡数。也能同时降低首token时延和增量推理时延。支持SmoothQuant(W8A8)量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何在Noteboo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
在推理生产环境中部署推理服务 - AI开发平台ModelArts

若权重文件大于60G，创建AI应用会报错，提示模型大于60G，请提工单扩容。 Step3 部署在线服务将Step2 部署模型中创建的AI应用部署为一个在线服务，用于推理调用。在ModelArts控制台，单击“模型部署 > 在线服务 > 部署”，开始部署在线服务。设置部署服务名称，选择Step2 部署模型中创建的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
在ModelArts中图像分类和物体检测具体是什么？ - AI开发平台ModelArts

景，将下图识别为汽车的图片。图1 图像分类物体检测是计算机视觉中的经典问题之一，其任务是用框去标出图像中物体的位置，并给出物体的类别。通常在一张图包含多个物体的情况下，定制识别出每个物体的位置、数量、名称，适合图片中有多个主体的场景，针对下图检测出图片包含树和汽车。图2 物体检测

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习
在ModelArts中调整模型后，部署新版本模型能否保持原API接口不变？ - AI开发平台ModelArts

新版本模型或者切换模型版本时，原服务预测API不会变化。调整模型版本的操作可以参考如下的步骤。前提条件已存在部署完成的服务。已完成模型调整，创建模型。操作步骤登录ModelArts管理控制台，在左侧导航栏中选择“部署上线 > 在线服务”，默认进入“在线服务”列表。在

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
多模态 - AI开发平台ModelArts
多模态 - AI开发平台ModelArts

式是HuggingFace的目录格式。即上传的HuggingFace权重文件存放目录。如果使用了量化功能，则使用量化章节转换后的权重。如果使用的是训练后模型转换为HuggingFace格式的地址，还需要有Tokenizer原始文件。 --max-num-seqs：最大同时处理的请求数，超过后在等待池等候处理。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
训练物体检测模型 - AI开发平台ModelArts

训练物体检测模型自动学习物体检测项目，在图片标注完成后，通过模型训练得到合适的模型版本。操作步骤在新版自动学习页面，单击项目名称进入运行总览页面，单击“数据标注”节点的“实例详情”进入数据标注页面，完成数据标注。图1 完成数据标注返回新版自动学习页面，单击数据标注节点的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现物体检测
标注声音分类数据 - AI开发平台ModelArts

行标签的修改，数据的增加或删减。图1 数据标注节点状态音频标注在新版自动学习页面单击“实例详情”按钮，前往数据标注页面。单击任意一张图片，进入音频标注页面。在“音频标注”页面单击“未标注”页签，此页面展示所有未标注的音频数据。依次单击选中待标注的音频，或勾选“选择当前页”

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现声音分类
日志提示“CUDNN_STATUS_NOT_SUPPORTED. ” - AI开发平台ModelArts

处理方法禁用cuDNN，在训练前加入如下代码。 torch.backends.cudnn.enabled = False 将输入数据转换成contiguous。 images = images.cuda() images = images.permute(0, 3, 1,

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
在MaaS体验模型服务 - AI开发平台ModelArts

在左侧导航栏中，选择“模型部署”。在“模型部署”页面，任选以下方式进入模型体验页面。在“预置服务”页签，单击操作列“在线体验”，进入“模型体验”页面。在“我的服务”页签，单击操作列“更多 > 在线体验”，进入“模型体验”页面。在“模型体验”右上角，单击“参数设置”，拖动或直接输入数值配置推理参

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

lm_tools/spec_decode/EAGLE文件夹，使用convert_eagle_ckpt_to_vllm_compatible.py脚本进行权重转换。转换命令为 python convert_eagle_ckpt_to_vllm_compatible.py --base-path 大模型权重地址

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
删除服务 - AI开发平台ModelArts
删除服务 - AI开发平台ModelArts

删除服务存在如下两种删除方式。根据部署在线服务生成的服务对象删除服务。根据查询服务对象列表返回的服务对象删除服务。示例代码在ModelArts notebook平台，Session鉴权无需输入鉴权参数。其它平台的Session鉴权请参见Session鉴权。方式1：根据部署在线服务生成的服务对象删除服务

 帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理

总条数： 923

上一页
1
...
9
10
11
...
47
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

Eagle投机小模型训练 - AI开发平台ModelArts

Eagle投机小模型训练 - AI开发平台ModelArts

Eagle投机小模型训练 - AI开发平台ModelArts

启动推理服务 - AI开发平台ModelArts

管理AI Gallery镜像 - AI开发平台ModelArts

自动学习训练后的模型是否可以下载？ - AI开发平台ModelArts

使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

在ModelArts中图像分类和物体检测具体是什么？ - AI开发平台ModelArts

在ModelArts中调整模型后，部署新版本模型能否保持原API接口不变？ - AI开发平台ModelArts

多模态 - AI开发平台ModelArts

训练物体检测模型 - AI开发平台ModelArts

标注声音分类数据 - AI开发平台ModelArts

日志提示“CUDNN_STATUS_NOT_SUPPORTED. ” - AI开发平台ModelArts

在MaaS体验模型服务 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

删除服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线