搜索_华为云

使用SmoothQuant量化 - AI开发平台ModelArts

署的卡数。也能同时降低首token时延和增量推理时延。支持SmoothQuant(W8A8)量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何使用SmoothQuant量化工具实现推理量化。 SmoothQuant量化工具使用到的脚本存放在代码包AscendCloud-LLM-x

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
常见问题 - AI开发平台ModelArts
常见问题 - AI开发平台ModelArts

扩散模型在噪音和随机数上的生成，本身就有一定的随机性，GPU和NPU（Ascend）硬件由于存在一定细小的差别，很难确保完全一致，较难达成生成图片100%匹配，建议通过盲测的方式对效果进行验证。模型精度有问题怎么办？首先考虑通过FP16的方式进行转换和执行，再通过精度诊断

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
终止训练作业 - AI开发平台ModelArts

id只取算法的id； subscription_id+item_version_id取算法的订阅id和版本id； code_dir+boot_file取训练作业的代码目录和启动文件。 tasks Array of TaskResponse objects 异构训练作业的任务列表。 spec

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
使用SmoothQuant量化 - AI开发平台ModelArts

署的卡数。也能同时降低首token时延和增量推理时延。支持SmoothQuant(W8A8)量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何使用SmoothQuant量化工具实现推理量化。 SmoothQuant量化工具使用到的脚本存放在代码包AscendCloud-LLM-x

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
使用SmoothQuant量化 - AI开发平台ModelArts

署的卡数。也能同时降低首token时延和增量推理时延。支持SmoothQuant(W8A8)量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何使用SmoothQuant量化工具实现推理量化。 SmoothQuant量化工具使用到的脚本存放在代码包AscendCloud-LLM-x

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
在线服务预测时，如何提高预测速度？ - AI开发平台ModelArts

部署在线服务时，您可以选择性能更好的“计算节点规格”提高预测速度。例如使用GPU资源代替CPU资源。部署在线服务时，您可以增加“计算节点个数”。如果节点个数设置为1，表示后台的计算模式是单机模式；如果节点个数设置大于1，表示后台的计算模式为分布式的。您可以根据实际需求进行选择。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 在线服务
数据管理计费项 - AI开发平台ModelArts

据清洗、数据校验、数据选择和数据增强的数据处理任务时，不收费。但是存储到OBS中的数据会收取费用。具体内容如表1所示。表1 存储计费项计费项计费项说明适用的计费模式计费公式存储资源对象存储OBS 用于存储训练和推理的输入数据和输出结果数据。具体费用可参见对象存储价格详情。

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
停止计费 - AI开发平台ModelArts
停止计费 - AI开发平台ModelArts

止正在计费的项目。自动学习、Workflow、开发环境、模型训练、在线服务、专属资源池涉及到需要停止的计费项如下：自动学习：停止因运行自动学习作业而创建的训练作业和在线服务。删除存储到OBS中的数据及OBS桶。 Workflow：停止因运行Workflow作业而创建的训练作业和

 帮助中心 > AI开发平台ModelArts > 计费说明
配置IAM权限 - AI开发平台ModelArts

选择授权范围方案为“所有资源”，单击“确定”。精细化授权管理如果您需要进行精细的权限管理，可参考《ModelArts API参考》中的权限策略和授权项。数据管理权限开发环境权限训练作业权限模型管理权限服务管理权限工作空间管理权限精细化授权案例可参考管理员和开发者权限分离。父主题：权限配置

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置 > 权限配置
使用MaaS评测模型 - AI开发平台ModelArts

除使用Maas提供的评测能力外，您也可以在实际应用中验证模型的性能，进一步确保模型在真实环境中的表现符合预期。场景描述您可以使用预置数据集评测已部署的模型服务，更加直观地评估模型实际的输出效果。约束限制仅支持评测运行中的模型服务和已领取免费额度的预置服务。最多可以添加10个文本生成类型的模型服务。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
删除服务 - AI开发平台ModelArts
删除服务 - AI开发平台ModelArts

String 用户Token。通过调用IAM服务获取用户Token接口获取（响应消息头中X-Subject-Token的值）。响应参数无请求示例如下删除服务ID为xxxxxx的模型服务为例。 DELETE https://endpoint/v1/{project_id}/services/xxxxxx

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
给子账号配置部署上线基本使用权限 - AI开发平台ModelArts

本文介绍部署上线场景下子账号所需的基本使用权限，您可参考权限清单新增对应业务场景的权限。示例场景为授权子账号权限，使其能够在开发环境Notebook中使用基础镜像构建一个新的推理镜像，并完成模型的创建，部署为在线服务。权限清单权限表1 管理模型所需权限业务场景依赖的服务依赖策略项支持的功能配置建议

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
一般性问题 - AI开发平台ModelArts

如何用ModelArts训练基于结构化数据的模型？什么是区域、可用区？在ModelArts中如何查看OBS目录下的所有文件？ ModelArts数据集保存到容器的哪里？ ModelArts支持哪些AI框架？ ModelArts训练和推理分别对应哪些功能？如何查看账号ID和IAM用户ID ModelArts

帮助中心 > AI开发平台ModelArts > 常见问题
AI Gallery（新版） - AI开发平台ModelArts

Gallery（新版） AI Gallery使用流程发布和管理AI Gallery模型发布和管理AI Gallery数据集发布和管理AI Gallery项目发布和管理AI Gallery镜像发布和管理AI Gallery中的AI应用使用AI Gallery微调大师训练模型使用AI

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery）
主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） - AI开发平台ModelArts

主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） Ascend-vLLM介绍支持的模型列表版本说明和要求推理服务部署推理关键特性使用推理服务精度评测推理服务性能评测附录父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
使用AI Gallery SDK构建自定义模型 - AI开发平台ModelArts

Gallery在原有Transformers库的基础上，融入了对于昇腾硬件的适配与支持。对AI有使用诉求的企业、NLP领域开发者，可以借助这个库，便捷地使用昇腾算力进行自然语言理解（NLU）和自然语言生成（NLG）任务的SOTA模型开发与应用。支持的模型结构框架 AI Gallery的Transforme

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
查询资源池列表，可通过标签、资源池状态筛选查询资源池列表 - AI开发平台ModelArts

String 资源池状态。状态为空时，返回当前有效的资源池，包括创建中和创建成功的资源池。可选值如下： created: 创建成功的资源池。 failed：创建失败的资源池，创建失败的资源池记录保留3天。 creating：创建中的资源池。请求参数无响应参数状态码： 200

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
在模型广场查看模型 - AI开发平台ModelArts

在模型广场查看模型在模型广场页面，ModelArts Studio大模型即服务平台提供了丰富的开源大模型，在模型详情页可以查看模型的详细介绍，根据这些信息选择合适的模型进行训练、推理，接入到企业解决方案中。访问模型广场登录ModelArts管理控制台。在左侧导航栏中，选择“ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
API/SDK - AI开发平台ModelArts
API/SDK - AI开发平台ModelArts

SDK、OBS SDK和MoXing的区别？ ModelArts的API或SDK支持模型下载到本地吗？ ModelArts的SDK支持哪些安装环境？ ModelArts通过OBS的API访问OBS中的文件，算内网还是公网？调用API提交训练作业后，能否绘制作业的资源占用率曲线？如

 帮助中心 > AI开发平台ModelArts > 常见问题
使用kv-cache-int8量化 - AI开发平台ModelArts

运行完成后，会在output_dir下生成量化后的权重。量化后的权重包括原始权重和kvcache的scale系数。抽取kv-cache量化系数。该步骤的目的是将步骤1中生成的scale系数提取到单独文件中，供推理时使用。使用的抽取脚本由vllm社区提供： python3 e

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化

总条数： 1246

上一页
1
...
46
47
48
...
63
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用SmoothQuant量化 - AI开发平台ModelArts

常见问题 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

在线服务预测时，如何提高预测速度？ - AI开发平台ModelArts

数据管理计费项 - AI开发平台ModelArts

停止计费 - AI开发平台ModelArts

配置IAM权限 - AI开发平台ModelArts

使用MaaS评测模型 - AI开发平台ModelArts

删除服务 - AI开发平台ModelArts

给子账号配置部署上线基本使用权限 - AI开发平台ModelArts

一般性问题 - AI开发平台ModelArts

AI Gallery（新版） - AI开发平台ModelArts

主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） - AI开发平台ModelArts

使用AI Gallery SDK构建自定义模型 - AI开发平台ModelArts

查询资源池列表，可通过标签、资源池状态筛选查询资源池列表 - AI开发平台ModelArts

在模型广场查看模型 - AI开发平台ModelArts

API/SDK - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线