搜索_华为云

使用AWQ量化 - AI开发平台ModelArts

llm_tools/AutoAWQ bash build.sh 2、运行“examples/quantize.py”文件进行模型量化，量化时间和模型大小有关，预计30分钟~3小时。 pip install transformers==4.41.0 # AutoAWQ未适配transformers

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
FLUX.1基于DevServer适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

1-dev和FLUX.1-schnell。方案概览本方案介绍了在ModelArts Lite DevServer上使用昇腾计算资源Ascend Snt9B开展Flux模型的FLUX.1-dev和FLUX.1-schnell两个版本分别使用ComfyUI 0.2.2和Diffusers

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
部署推理服务 - AI开发平台ModelArts

n上的Cluster和昇腾Snt9b资源。安装过程需要连接互联网git clone，确保集群可以访问公网。 Step1 上传权重文件将权重文件上传到集群节点机器中。权重文件的格式要求为Huggingface格式。开源权重文件获取地址请参见支持的模型列表和权重文件。如果使用模

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
部署推理服务 - AI开发平台ModelArts

n上的Cluster和昇腾Snt9b资源。安装过程需要连接互联网git clone，确保集群可以访问公网。 Step1 上传权重文件将权重文件上传到集群节点机器中。权重文件的格式要求为Huggingface格式。开源权重文件获取地址请参见支持的模型列表和权重文件。如果使用模

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
使用AOM查看Lite Cluster监控指标 - AI开发平台ModelArts

际情况替换containerName参数和command参数 spec: containers: - name: my-task image: my-task-image:latest # 替换为实际使用的镜像业务负载和自定义指标采集可以共用一个容器，也可以由S

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理 > 监控Lite Cluster资源
查询推理服务标签 - AI开发平台ModelArts

tags 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String 用户Token。通

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
查询模型对象列表 - AI开发平台ModelArts

参数说明查询模型列表，返回list，list大小等于当前用户所有已经部署的模型个数， list中每个元素都是Model对象，对象属性和查询模型详情相同。查询模型列表返回说明： model_list = [model_instance1, model_instance2, model_instance3

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
使用AWQ量化 - AI开发平台ModelArts

llm_tools/AutoAWQ bash build.sh 2、运行“examples/quantize.py”文件进行模型量化，量化时间和模型大小有关，预计30分钟~3小时。 pip install transformers==4.41.0 # AutoAWQ未适配transformers

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
团队成员查询团队标注任务列表 - AI开发平台ModelArts

asks 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 limit 否 Integer 指定每一页返回的最大条目数，取值范围[1,100]，默认为10。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

3.2）。仅支持FP16和BF16数据类型推理。适配的CANN版本是cann_8.0.rc2，驱动版本是23.0.5。本案例仅支持在专属资源池上运行。支持的模型列表本方案支持的模型列表、对应的开源权重获取地址如表1所示。表1 支持的模型列表和权重获取地址序号支持模型

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
SD1.5&SDXL ComfyUI、WebUI、Diffusers套件适配PyTorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

本方案目前仅适用于企业客户。资源规格要求推理部署推荐使用“西南-贵阳一”Region上的DevServer资源和Ascend Snt9B和300IDUO。获取软件和镜像表1 获取软件和镜像分类名称获取路径插件代码包 AscendCloud-6.3.909软件包中的AscendCloud-AIGC-6

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

场景说明本文详细介绍如何将本地已经制作好的模型包导入ModelArts的开发环境Notebook中进行调试和保存，然后将保存后的镜像部署到推理。本案例仅适用于华为云北京四和上海一站点。操作流程如下： Step1 在Notebook中复制模型包 Step2 在Notebook中调试模型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

ignore_eos 否 False Bool ignore_eos表示是否忽略EOS并且继续生成token。 Step5 推理性能和精度测试推理性能和精度测试操作请参见推理性能测试和推理精度测试。父主题：主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
部署图像分类服务 - AI开发平台ModelArts

预测”页签单击“上传”，选择本地图片进行测试。单击“预测”进行测试，预测完成后，右侧“预测结果”区域输出标签名称“sunflowers”和检测的评分。如模型准确率不满足预期，可在“数据标注”页签中添加图片并进行标注，重新进行模型训练及模型部署。预测结果中的参数说明请参见表1。如

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现图像分类
获取用户绑定APP的api列表 - AI开发平台ModelArts

参数类型描述 app_id 是 String APP编号。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 limit 否 String 分页展示时，一页展示多少项。默认为1000。 offset

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
获取Workflow工作流节点度量信息 - AI开发平台ModelArts

rics 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 workflow_id 是 String 工作流的ID。 execution_id 是 String 工作流执行ID。 step_execution_id

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
续费概述 - AI开发平台ModelArts
续费概述 - AI开发平台ModelArts

源状态变为“已冻结”。超过宽限期仍未续费将进入保留期，如果保留期内仍未续费，资源将被自动删除。华为云根据客户等级定义了不同客户的宽限期和保留期时长。在专属资源池到期前均可开通自动续费，到期前7日凌晨3:00首次尝试自动续费，如果扣款失败，每天凌晨3:00尝试一次，直至专属资

 帮助中心 > AI开发平台ModelArts > 计费说明 > 续费
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

"top_k": -1 "use_beam_search":true "best_of":2 Step5 推理性能和精度测试推理性能和精度测试操作请参见推理性能测试和推理精度测试。父主题：主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

\"bow\", \"crossbow\"], \"type\": \"string\"}}}" }' Step5 推理性能和精度测试推理性能和精度测试操作请参见推理性能测试和推理精度测试。附录：基于vLLM（v0.3.2）不同模型推理支持的max-model-len长度说明基于vLLM（v0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
上传本地文件至JupyterLab - AI开发平台ModelArts

解压命令的更多使用说明可以在主流搜索引擎中查找Linux解压命令操作。多个文件同时上传时，JupyterLab窗口最下面会显示上传文件总数和已上传文件数。上传文件入口方式一：使用JupyterLab打开一个运行中的Notebook环境。图1 直接将文件拖拽到JupyterLab窗口左边的空白处上传。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发 > 上传文件至JupyterLab

总条数： 1193

上一页
1
...
55
56
57
...
60
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用AWQ量化 - AI开发平台ModelArts

FLUX.1基于DevServer适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

使用AOM查看Lite Cluster监控指标 - AI开发平台ModelArts

查询推理服务标签 - AI开发平台ModelArts

查询模型对象列表 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

团队成员查询团队标注任务列表 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

SD1.5&SDXL ComfyUI、WebUI、Diffusers套件适配PyTorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

部署图像分类服务 - AI开发平台ModelArts

获取用户绑定APP的api列表 - AI开发平台ModelArts

获取Workflow工作流节点度量信息 - AI开发平台ModelArts

续费概述 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

上传本地文件至JupyterLab - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线