搜索_华为云

使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

能同时降低首token时延和增量推理时延。支持SmoothQuant(W8A8)量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何在Notebook使用SmoothQuant量化工具实现推理量化。 SmoothQuant量化工具使用到的脚本存放在代码包AscendCloud-LLM-x

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
创建声音分类项目 - AI开发平台ModelArts

应的工作流。单击搜索框右侧的按钮，可选择自动学习的基础设置，需要的显示列。表格内容折行：默认为关闭状态，启用此能力可让表格内容自动折行，禁用此功能可截断文本。操作列：默认为关闭状态，启用此能力可让操作列固定在最后一列永久可见。自定义显示列：默认所有显示项全部勾选，您可以根据实际需要定义您的显示列。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现声音分类
推理性能测试 - AI开发平台ModelArts

100，数量需和--request-rate的数量对应。 --max-tokens：输入+输出限制的最大长度，模型启动参数--max-input-length值需要大于该值。 --max-prompt-tokens：输入限制的最大长度，推理时最大输入tokens数量，模型启动参数--max-tota

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
推理性能测试 - AI开发平台ModelArts

100，数量需和--request-rate的数量对应。 --max-tokens：输入+输出限制的最大长度，模型启动参数--max-input-length值需要大于该值。 --max-prompt-tokens：输入限制的最大长度，推理时最大输入tokens数量，模型启动参数--max-tota

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908）
准备预测分析数据 - AI开发平台ModelArts

型时的输出（预测项）。除标签列外数据集中至少还应包含两个有效特征列（列的取值至少有两个且数据缺失比例低于10%）。当前由于特征筛选算法限制，预测数据列建议放在数据集最后一列，否则可能导致训练失败。表格数据集示例：以银行存款预测数据集为例：根据预测人的年龄、工作类型、婚姻状

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现预测分析
Qwen-VL基于DevServer适配Pytorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

作为输入，并以文本和检测框作为输出。具有强大的性能、多语言对话、多图交错对话、支持中文开放域定位、细粒度识别和理解等特点。本文档主要介绍如何利用训练框架PyTorch_npu + 华为自研Ascend Snt9B硬件，完成Qwen-VL推理。资源规格要求推荐使用“西南-贵阳

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
分离部署推理服务 - AI开发平台ModelArts

分离部署推理服务本章节介绍如何使用vLLM 0.6.0框架部署并启动推理服务。什么是分离部署大模型推理是自回归的过程，有以下两阶段： Prefill阶段（全量推理）将用户请求的prompt传入大模型，进行计算，中间结果写入KVCache并推出第1个token，属于计算密集型。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 部署推理服务
使用MaaS调优模型 - AI开发平台ModelArts

选择是否打开“永久保存日志”开关。开关关闭（默认关闭）：表示不永久保存日志，则任务日志会在30天后会被清理。可以在任务详情页下载全部日志至本地。开关打开：表示永久保存日志，此时必须配置“日志路径”，系统会将任务日志永久保存至指定的OBS路径。事件通知选择是否打开“事件通知”开关。开关关闭（默认关闭）：表示不启用消息通知服务。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
使用SmoothQuant量化 - AI开发平台ModelArts

能同时降低首token时延和增量推理时延。支持SmoothQuant(W8A8)量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何使用SmoothQuant量化工具实现推理量化。 SmoothQuant量化工具使用到的脚本存放在代码包AscendCloud-LLM-x

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用SmoothQuant量化 - AI开发平台ModelArts

能同时降低首token时延和增量推理时延。支持SmoothQuant(W8A8)量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何使用SmoothQuant量化工具实现推理量化。 SmoothQuant量化工具使用到的脚本存放在代码包AscendCloud-LLM-x

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
创建物体检测项目 - AI开发平台ModelArts

应的工作流。单击搜索框右侧的按钮，可选择自动学习的基础设置，需要的显示列。表格内容折行：默认为关闭状态，启用此能力可让表格内容自动折行，禁用此功能可截断文本。操作列：默认为关闭状态，启用此能力可让操作列固定在最后一列永久可见。自定义显示列：默认所有显示项全部勾选，您可以根据实际需要定义您的显示列。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现物体检测
创建文本分类项目 - AI开发平台ModelArts

应的工作流。单击搜索框右侧的按钮，可选择自动学习的基础设置，需要的显示列。表格内容折行：默认为关闭状态，启用此能力可让表格内容自动折行，禁用此功能可截断文本。操作列：默认为关闭状态，启用此能力可让操作列固定在最后一列永久可见。自定义显示列：默认所有显示项全部勾选，您可以根据实际需要定义您的显示列。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现文本分类
在ECS中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

python3 python3-pip && \ pip3 install --trusted-host https://repo.huaweicloud.com -i https://repo.huaweicloud.com/repository/pypi/simple Flask

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

with diffusers。推理业务迁移到昇腾的通用流程，可参考GPU推理业务迁移至昇腾的通用指导。由于Huggingface网站的限制，访问Stable Diffusion链接时需使用代理服务器，否则可能无法访问网站。在Stable Diffusion迁移适配时，更多的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
创建图像分类项目 - AI开发平台ModelArts

应的工作流。单击搜索框右侧的按钮，可选择自动学习的基础设置，需要的显示列。表格内容折行：默认为关闭状态，启用此能力可让表格内容自动折行，禁用此功能可截断文本。操作列：默认为关闭状态，启用此能力可让操作列固定在最后一列永久可见。自定义显示列：默认所有显示项全部勾选，您可以根据实际需要定义您的显示列。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现图像分类
创建预测分析项目 - AI开发平台ModelArts

应的工作流。单击搜索框右侧的按钮，可选择自动学习的基础设置，需要的显示列。表格内容折行：默认为关闭状态，启用此能力可让表格内容自动折行，禁用此功能可截断文本。操作列：默认为关闭状态，启用此能力可让操作列固定在最后一列永久可见。自定义显示列：默认所有显示项全部勾选，您可以根据实际需要定义您的显示列。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现预测分析
LLaVA模型基于DevServer适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

Vicuna，用于通用的视觉和语言理解，实现了令人印象深刻的聊天能力，在科学问答（Science QA）上达到了新的高度。本文档主要介绍如何利用ModelArts Lite DevServer，使用PyTorch_npu+华为自研Ascend Snt9B硬件，完成LLaVA模型推理。

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
查询Notebook实例列表 - AI开发平台ModelArts

description String 该镜像所对应的描述信息，长度限制512个字符。 dev_services Array of strings 镜像支持的服务。枚举值如下： NOTEBOOK：镜像支持通过https协议访问Notebook。 SSH：镜像支持本地IDE通过SSH协议远程连接Notebook。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
查询所有Notebook实例列表 - AI开发平台ModelArts

description String 该镜像所对应的描述信息，长度限制512个字符。 dev_services Array of strings 镜像支持的服务。枚举值如下： NOTEBOOK：镜像支持通过https协议访问Notebook。 SSH：镜像支持本地IDE通过SSH协议远程连接Notebook。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
创建Standard专属资源池 - AI开发平台ModelArts

控制节点高可用：开启后，系统为您的集群创建三个控制平面节点，确保集群的可靠性。如果集群规模为1000/2000节点，则必须开启。如果关闭高可用，您的集群只会创建一个控制平面节点。资源池创建后，控制节点高可用的开启或关闭状态不可修改。控制节点分布：可以选择随机分配，也可以指定可用区。控制节点推荐尽可能随机分布在不同可用区以提高容灾能力。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理

总条数： 1195

上一页
1
...
20
21
22
...
60
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用SmoothQuant量化工具转换权重 - AI开发平台ModelArts

创建声音分类项目 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

准备预测分析数据 - AI开发平台ModelArts

Qwen-VL基于DevServer适配Pytorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

使用MaaS调优模型 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

创建物体检测项目 - AI开发平台ModelArts

创建文本分类项目 - AI开发平台ModelArts

在ECS中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

创建图像分类项目 - AI开发平台ModelArts

创建预测分析项目 - AI开发平台ModelArts

LLaVA模型基于DevServer适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

查询Notebook实例列表 - AI开发平台ModelArts

查询所有Notebook实例列表 - AI开发平台ModelArts

创建Standard专属资源池 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线