搜索_华为云

从训练作业中导入模型文件创建模型 - AI开发平台ModelArts

支持3条。 “部署类型” 选择此模型支持部署服务的类型，部署上线时只支持部署为此处选择的部署类型，例如此处只选择在线服务，那您导入后只能部署为在线服务。当前支持“在线服务”、“批量服务”和“边缘服务”。确认信息填写无误，单击“立即创建”，完成模型的创建。在模型列表中，您可以查

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
约束与限制 - AI开发平台ModelArts

一个账号最多创建10个Notebook。否更多信息，请参见创建Notebook实例。 Standard推理部署在线服务单个账号最多可创建20个在线服务。是提交工单申请提升配额更多信息，请参见部署在线服务。 Standard推理部署批量服务单个账号最多可创建1000个批量服务。否更多信息，请参见部署批量服务。

帮助中心 > AI开发平台ModelArts > 产品介绍
查询模型runtime - AI开发平台ModelArts

04-x86_64 request_mode Array of strings 请求模式，AI引擎支持部署为同步在线服务或异步在线服务。 sync：同步在线服务 async：异步在线服务 accelerators Array of Accelerator objects AI引擎可使用的加速卡。

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
免费体验MaaS预置服务 - AI开发平台ModelArts

在“模型部署”页面的“预置服务”页签，任选以下方式免费体验预置服务。方式一：在“模型体验”页面进行推理。在目标服务右侧，单击操作列的“在线体验”，跳转到“模型体验”页面，在右上角单击“参数设置”，按需配置相关参数，即可开始问答体验。操作指导请参见在MaaS体验模型服务。表1

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
查询镜像详情 - AI开发平台ModelArts

SSH：镜像支持本地IDE通过SSH协议远程连接Notebook。 id String 待创建Notebook实例的镜像，需要指定镜像ID，ID格式为通用唯一识别码（Universally Unique Identifier，简称UUID）。预置镜像的ID参考查询支持的镜像列表获取。 name String

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
标注声音分类数据 - AI开发平台ModelArts

频数据。依次单击选中待标注的音频，或勾选“选择当前页”选中该页面所有音频，在页面右侧进行标注。图2 音频标注添加标注。先对音频进行播放识别，然后选中音频文件，在右侧“标签”区域，输入“标签名”或从下拉列表中选择已添加的标签，同时可在下拉菜单中选择标签“快捷键”。单击“确定”，完成选中音频的标注操作。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现声音分类
删除镜像 - AI开发平台ModelArts
删除镜像 - AI开发平台ModelArts

SSH：镜像支持本地IDE通过SSH协议远程连接Notebook。 id String 待创建Notebook实例的镜像，需要指定镜像ID，ID格式为通用唯一识别码（Universally Unique Identifier，简称UUID）。预置镜像的ID参考查询支持的镜像列表获取。 name String

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
guided-decoding - AI开发平台ModelArts

print(outputs[0].outputs[0].text) MODEL_NAME表示对应模型路径。在线推理使用Guided Decoding 启动推理服务请参考启动推理服务章节。在线推理使用Guided Decoding时，在发送的请求中包含上述guided_json架构，具体示例可参考以下代码。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
调用MaaS部署的模型服务 - AI开发平台ModelArts

400 Bad Request 请求包含语法错误。 403 Forbidden 服务器拒绝执行。 404 Not Found 服务器找不到请求的网页。 500 Internal Server Error 服务内部错误。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
模型配置文件编写说明 - AI开发平台ModelArts

针对机器学习类模型，仅支持“application/json” data 在线服务-非必选批量服务-必选 String 请求体以json schema描述。参数说明请参考官方指导。表5 response结构说明参数是否必选参数类型描述 Content-type 在线服务-非必选批量服务-必选 String

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
更新管理 - AI开发平台ModelArts
更新管理 - AI开发平台ModelArts

更新管理 ModelArts在线服务更新对于已部署的推理服务，ModelArts支持通过更换模型的版本号，实现服务升级。推理服务有三种升级模式：全量升级、滚动升级（扩实例）和滚动升级（缩实例）。了解三种升级模式的流程，请参见图1。全量升级需要额外的双倍的资源，先全量创建新版本实例，然后再下线旧版本实例。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
Notebook使用场景 - AI开发平台ModelArts

PyTorch、TensorFlow和MindSpore等引擎的AI模型。支持通过JupyterLab工具在线打开Notebook，具体请参见通过JupyterLab在线使用Notebook实例进行AI开发。支持本地IDE的方式开发模型，通过开启SSH连接，用户本地IDE可以

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
Standard数据管理 - AI开发平台ModelArts

ModelArts Standard数据管理支持多维度数据管理能力数据集管理：提供数据集创建、数据预览、数据集版本管理等能力数据标注：提供在线标注能力，包含图像分类、目标检测、音频分割、文本三元组等标注场景；提供图片智能标注方案，提升标注效率；提供团队标注能力，支持多人协同标注与标注任务的审核验收

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
创建Workflow服务部署节点 - AI开发平台ModelArts

主要在服务部署节点的输出中使用如果您没有特殊需求，可直接使用内置的默认值。使用案例主要包含三种场景的用例：新增在线服务更新在线服务服务部署输出推理地址新增在线服务 import modelarts.workflow as wf # 通过ServiceStep来定义一个服务部署节点，输入指定的模型进行服务部署

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
管理AI Gallery模型 - AI开发平台ModelArts

像无法正常使用AI Gallery工具链服务（微调大师和在线推理服务）。说明：建议写清楚模型的使用方法，方便使用者更好的完成训练、推理任务。表2 任务类型支持的AI Gallery工具链服务任务类型微调大师在线推理服务 AI应用文本问答/文本生成支持支持支持其他类型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型
确认智能标注作业的数据难例 - AI开发平台ModelArts

目前只有“图像分类”和“物体检测”类型的数据集支持难例发现功能。智能标注后，确认难例 “智能标注”任务执行过程中，ModelArts将自动识别难例，并完成标注。当智能标注结束后，难例标注结果将呈现在“待确认”页签，建议您对难例数据进行人工修正，然后确认标注。登录ModelArt

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过智能标注方式标注数据
部署服务 - AI开发平台ModelArts
部署服务 - AI开发平台ModelArts

infer_type 是 String 推理方式，取值为real-time/batch/edge。 real-time代表在线服务，将模型部署为一个Web Service，并且提供在线的测试UI与监控能力，服务一直保持运行。 batch为批量服务，批量服务可对批量数据进行推理，完成数据处理后自动停止。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
启动智能任务 - AI开发平台ModelArts

Integer 模型部署的实例数，即计算节点的个数。 model_id 否 String 模型ID。 specification 否 String 在线服务的资源规格。详见部署服务 weight 否 Integer 权重百分比，分配到此模型的流量权重；仅当infer_type为real-t

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查看训练作业详情 - AI开发平台ModelArts

“代码目录” 训练作业代码目录所在的OBS路径。您可以单击代码目录后的“编辑代码”，在“OBS在线编辑”对话框中实时编辑训练脚本代码。当训练作业状态为“等待中”、“创建中”和“运行中”时，不支持“OBS在线编辑”功能。说明：当您使用订阅算法创建训练作业时，不支持该参数。 “启动文件” 训练作业启动文件位置。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
W4A16量化 - AI开发平台ModelArts
W4A16量化 - AI开发平台ModelArts

步骤二：权重格式离线转换（可选）在GPU上AutoAWQ量化完成后，使用int32对int4的权重进行打包。昇腾上使用int8对权重进行打包，在线转换会增加启动时间，可以提前对权重进行转换以减少启动时间，转换步骤如下：进入llm_tools/AutoAWQ代码目录下执行以下脚本：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 量化

总条数： 398

上一页
1
...
12
13
14
...
20
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

从训练作业中导入模型文件创建模型 - AI开发平台ModelArts

约束与限制 - AI开发平台ModelArts

查询模型runtime - AI开发平台ModelArts

免费体验MaaS预置服务 - AI开发平台ModelArts

查询镜像详情 - AI开发平台ModelArts

标注声音分类数据 - AI开发平台ModelArts

删除镜像 - AI开发平台ModelArts

guided-decoding - AI开发平台ModelArts

调用MaaS部署的模型服务 - AI开发平台ModelArts

模型配置文件编写说明 - AI开发平台ModelArts

更新管理 - AI开发平台ModelArts

Notebook使用场景 - AI开发平台ModelArts

Standard数据管理 - AI开发平台ModelArts

创建Workflow服务部署节点 - AI开发平台ModelArts

管理AI Gallery模型 - AI开发平台ModelArts

确认智能标注作业的数据难例 - AI开发平台ModelArts

部署服务 - AI开发平台ModelArts

启动智能任务 - AI开发平台ModelArts

查看训练作业详情 - AI开发平台ModelArts

W4A16量化 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线