搜索_华为云

使用kv-cache-int8量化 - AI开发平台ModelArts

--quantization-param-path kv_cache_scales.json #输入Step2 抽取kv-cache量化系数生成的json文件路径; 如果只测试推理功能和性能，不需要此json文件，此时scale系数默认为1，但是可能会造成精度下降。父主题：推理模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用kv-cache-int8量化 - AI开发平台ModelArts

--quantization-param-path kv_cache_scales.json #输入Step2 抽取kv-cache量化系数生成的json文件路径; 如果只测试推理功能和性能，不需要此json文件，此时scale系数默认为1，但是可能会造成精度下降。父主题：推理模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
AI开发基本流程介绍 - AI开发平台ModelArts

一些常用的指标，如准确率、召回率、AUC等，能帮助您有效的评估，最终获得一个满意的模型。部署模型模型的开发训练，是基于之前的已有数据（有可能是测试数据），而在得到一个满意的模型之后，需要将其应用到正式的实际数据或新产生数据中，进行预测、评价、或以可视化和报表的形式把数据中的高价值信息

 帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
使用kv-cache-int8量化 - AI开发平台ModelArts

--quantization-param-path kv_cache_scales.json #输入Step2 抽取kv-cache量化系数生成的json文件路径; 如果只测试推理功能和性能，不需要此json文件，此时scale系数默认为1，但是可能会造成精度下降。父主题：推理模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
迁移过程使用工具概览 - AI开发平台ModelArts

于昇腾推理。精度性能检查工具 Benchmark精度检查工具，可以转换模型后执行推理前，使用其对MindSpore Lite模型进行基准测试，它不仅可以对MindSpore Lite模型前向推理执行耗时进行定量分析（性能），还可以通过指定模型输出进行可对比的误差分析（精度）。模型自动调优工具

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
免费体验MaaS预置服务 - AI开发平台ModelArts

在“模型部署”页面的“预置服务”页签，任选以下方式免费体验预置服务。方式一：在“模型体验”页面进行推理。在目标服务右侧，单击操作列的“在线体验”，跳转到“模型体验”页面，在右上角单击“参数设置”，按需配置相关参数，即可开始问答体验。操作指导请参见在MaaS体验模型服务。表1

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
自动学习训练作业失败 - AI开发平台ModelArts

数据集文件有以下限制：如果您使用2u8g规格，测试建议数据集文件应小于10MB。当文件大小符合限制要求，如果存在极端的数据规模（行数列数之积）时，仍可能会导致训练失败，建议的数据规模低于10000。如果您使用8u32g规格，测试建议数据集文件应小于100MB。当文件大小符合限

 帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 模型训练
使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

步骤六：预测分析运行完成的工作流会自动部署相应的在线服务，您只需要在相应的服务详情页面进行预测即可。在服务部署节点单击“实例详情”或者在ModelArts管理控制台，选择“模型部署 > 在线服务”，单击生成的在线服务名称，即可进入在线服务详情页。在服务详情页，单击选择“预测”页签。

帮助中心 > AI开发平台ModelArts > 快速入门
使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

步骤六：预测分析运行完成的工作流会自动部署相应的在线服务，您只需要在相应的服务详情页面进行预测即可。在服务部署节点单击“实例详情”或者在ModelArts管理控制台，选择“模型部署 > 在线服务”，单击生成的在线服务名称，即可进入在线服务详情页。在服务详情页，单击选择“预测”页签。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard自动学习
预测API的域名停用公告 - AI开发平台ModelArts

即切换使用新域名。为保障持续提供推理服务，请您及时更新业务中的预测API的域名。如果您使用的是VPC内部节点访问ModelArts推理的在线服务，预测API切换域名后，由于内网VPC无法识别公网域名，请提交工单联系华为云技术支持打通网络。父主题：产品变更公告

 帮助中心 > AI开发平台ModelArts > 服务公告 > 产品变更公告
管理员和开发者权限分离 - AI开发平台ModelArts

”。管理员不做权限控制，此处默认使用普通用户委托即可。勾选“我已经详细阅读并同意《 ModelArts服务声明》”，单击“创建”。测试管理员用户权限。使用管理员用户登录ModelArts管理控制台。在登录页面，请使用“IAM用户登录”方式进行登录。首次登录会提示修改密码，请根据界面提示进行修改。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
guided-decoding - AI开发平台ModelArts

print(outputs[0].outputs[0].text) MODEL_NAME表示对应模型路径。在线推理使用Guided Decoding 启动推理服务请参考启动推理服务章节。在线推理使用Guided Decoding时，在发送的请求中包含上述guided_json架构，具体示例可参考以下代码。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
在ModelArts Studio基于Qwen2-7B模型实现新闻自动分类 - AI开发平台ModelArts

专属模型。调优模型：使用不同的调优参数去训练模型。部署模型服务：将调优后的模型部署成模型服务。使用模型服务：在MaaS体验模型服务，测试推理结果。结果分析：分析模型的调优结果和推理结果，对比新闻分类效果。方案优势高准确性：利用模型强大的语义理解能力，系统能够准确识别新

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
更新管理 - AI开发平台ModelArts
更新管理 - AI开发平台ModelArts

更新管理 ModelArts在线服务更新对于已部署的推理服务，ModelArts支持通过更换模型的版本号，实现服务升级。推理服务有三种升级模式：全量升级、滚动升级（扩实例）和滚动升级（缩实例）。了解三种升级模式的流程，请参见图1。全量升级需要额外的双倍的资源，先全量创建新版本实例，然后再下线旧版本实例。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
获取智能任务的信息 - AI开发平台ModelArts

SampleLabels objects 视频在线服务推理结果。 service_id String 在线服务ID。 service_name String 在线服务名称。 service_resource String 用户绑定的在线服务资源ID。 total_sample_count

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
Notebook使用场景 - AI开发平台ModelArts

PyTorch、TensorFlow和MindSpore等引擎的AI模型。支持通过JupyterLab工具在线打开Notebook，具体请参见通过JupyterLab在线使用Notebook实例进行AI开发。支持本地IDE的方式开发模型，通过开启SSH连接，用户本地IDE可以

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
Standard数据管理 - AI开发平台ModelArts

ModelArts Standard数据管理支持多维度数据管理能力数据集管理：提供数据集创建、数据预览、数据集版本管理等能力数据标注：提供在线标注能力，包含图像分类、目标检测、音频分割、文本三元组等标注场景；提供图片智能标注方案，提升标注效率；提供团队标注能力，支持多人协同标注与标注任务的审核验收

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
创建Workflow服务部署节点 - AI开发平台ModelArts

主要在服务部署节点的输出中使用如果您没有特殊需求，可直接使用内置的默认值。使用案例主要包含三种场景的用例：新增在线服务更新在线服务服务部署输出推理地址新增在线服务 import modelarts.workflow as wf # 通过ServiceStep来定义一个服务部署节点，输入指定的模型进行服务部署

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
部署推理服务 - AI开发平台ModelArts

(Press CTRL+C to quit) Step7 推理请求使用命令测试推理服务是否正常启动。服务启动命令中的参数设置请参见表1。方式一：通过OpenAI服务API接口启动服务使用以下推理测试命令。${docker_ip}替换为实际宿主机的IP地址。如果启动服务未添加s

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907）
管理AI Gallery模型 - AI开发平台ModelArts

像无法正常使用AI Gallery工具链服务（微调大师和在线推理服务）。说明：建议写清楚模型的使用方法，方便使用者更好的完成训练、推理任务。表2 任务类型支持的AI Gallery工具链服务任务类型微调大师在线推理服务 AI应用文本问答/文本生成支持支持支持其他类型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型

总条数： 506

上一页
1
...
17
18
19
...
26
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用kv-cache-int8量化 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

AI开发基本流程介绍 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

迁移过程使用工具概览 - AI开发平台ModelArts

免费体验MaaS预置服务 - AI开发平台ModelArts

自动学习训练作业失败 - AI开发平台ModelArts

使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

预测API的域名停用公告 - AI开发平台ModelArts

管理员和开发者权限分离 - AI开发平台ModelArts

guided-decoding - AI开发平台ModelArts

在ModelArts Studio基于Qwen2-7B模型实现新闻自动分类 - AI开发平台ModelArts

更新管理 - AI开发平台ModelArts

获取智能任务的信息 - AI开发平台ModelArts

Notebook使用场景 - AI开发平台ModelArts

Standard数据管理 - AI开发平台ModelArts

创建Workflow服务部署节点 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

管理AI Gallery模型 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线