搜索_华为云

使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

Gallery工具链服务部署完成后将一直处于“运行中”。指定时长：设置作业运行几小时后停止，当AI Gallery工具链服务运行时长达到指定时长时，系统将会暂停作业。时长设置不能超过计算资源的剩余额度。说明：如果选择付费资源，则请确认账号未欠费，且余额高于所选计算规格的收费标准，否则可能会导致AI

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
简介 - AI开发平台ModelArts
简介 - AI开发平台ModelArts

本文旨在指导客户将已有的推理业务迁移到昇腾设备上运行（单机单卡、单机多卡），并获得更好的推理性能收益。 ModelArts针对上述使用场景，在给出系统化推理业务昇腾迁移方案的基础上，提供了即开即用的云上集成开发环境，包含迁移所需要的算力资源和工具链，以及具体的Notebook代码运行示例

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
自定义脚本代码示例 - AI开发平台ModelArts

signature_defs: signature.append(signature_def) if len(signature) == 1: model_signature = signature[0]

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
更新Workflow Execution - AI开发平台ModelArts

JobInput objects 节点的输入项。 outputs 否 Array of JobOutput objects 节点的输出项。 step_uuid 否 String 节点的UUID，唯一性标识。 properties 否 Map<String,Object> 节点的属性。 events

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
修改在线服务配置 - AI开发平台ModelArts

任务。当修改了服务的某些参数配置时，系统会自动重启服务使修改生效。在提交修改服务任务时，如果涉及重启，会有弹窗提醒。在线服务参数说明请参见部署模型为在线服务。修改在线服务还需要配置“最大无效实例数”设置并行升级的最大节点数，升级阶段节点无效。方式二：通过服务详情页面修改服务信息

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
查询服务日志 - AI开发平台ModelArts

为real-time时，会返回此值。 success_num Number 操作成功的节点数，当infer_type为edge时，会返回此值。 failed_num Number 操作失败的节点数，当infer_type为edge时，会返回此值。 result_detail Result结构数组

 帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
管理Workflow StepExecution - AI开发平台ModelArts

JobInput objects 节点的输入项。 outputs Array of JobOutput objects 节点的输出项。 step_uuid String 节点的UUID，唯一性标识。 properties Map<String,Object> 节点的属性。 events Array

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
训练启动脚本说明和参数配置 - AI开发平台ModelArts

不同模型推荐的训练参数和计算规格要求如表2所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表2 不同模型推荐的参数与NPU卡数设置序号支持模型支持模型参数量文本序列长度并行参数设置规格与节点数 1 llama2 llama2-7b SEQ_LEN=4096

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907） > 训练脚本说明
管理Workflow Execution - AI开发平台ModelArts

JobInput objects 节点的输入项。 outputs Array of JobOutput objects 节点的输出项。 step_uuid String 节点的UUID，唯一性标识。 properties Map<String,Object> 节点的属性。 events Array

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
管理AI Gallery模型 - AI开发平台ModelArts

Gallery工具链服务中使用该模型时，只能选取等同或高于该规格的算力资源进行任务下发。是否支持分布式训练/推理选择该模型资产是否支持在单机多卡的资源节点上进行并行训练或推理。 README.md - 资产的README内容，支持添加资产的简介、使用场景、使用方法等信息。当托管的是自定义镜

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型
计算规格说明 - AI开发平台ModelArts

计费的最小单位为秒，话单上报后的每一小时对用户账号进行一次扣费。如果使用过程中暂停、终止了消耗资源的AI Gallery工具链服务，即服务不处于计费的状态中，则系统不会立即扣费，依然等到满1小时后再进行扣费，且基于当前1小时内的实际使用时长进行扣费。实际计费规则资源按时价扣费，真正计费的价格以实际账单为准。查看账单请参见账单介绍。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
训练启动脚本说明和参数配置 - AI开发平台ModelArts

不同模型推荐的训练参数和计算规格要求如表2所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表2 不同模型推荐的参数与NPU卡数设置序号支持模型支持模型参数量文本序列长度并行参数设置规格与节点数 1 llama2 llama2-7b SEQ_LEN=4096

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
使用大模型在ModelArts Standard创建AI应用部署在线服务 - AI开发平台ModelArts

约束与限制需要申请单个AI应用大小配额和添加使用节点本地存储缓存的白名单。需要使用自定义引擎Custom，配置动态加载。需要使用专属资源池部署服务。专属资源池磁盘空间需大于1T。操作事项申请扩大AI应用的大小配额和使用节点本地存储缓存白名单上传模型数据并校验上传对象的一致性

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

如果图片不是（1，336，336）shape，将会被resize。 --image-feature-size：图片输入解析维度大小；llava-v1.6图片输入维度与image-feature-size关系映射表见git；计算原理如下：最小处理单元为14*14 【llava1.5】

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

流会自动从数据标注节点开始运行。您需要做的是：观察数据标注节点，待数据标注节点变为橙色即为“等待操作”状态。双击数据标注节点，打开数据标注节点的运行详情页面，单击“继续运行”。在弹出的窗口中，单击“确定”，工作流会开始继续运行。当工作流运行到“服务部署”节点，状态会变为“等待

 帮助中心 > AI开发平台ModelArts > 快速入门
使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

流会自动从数据标注节点开始运行。您需要做的是：观察数据标注节点，待数据标注节点变为橙色即为“等待操作”状态。双击数据标注节点，打开数据标注节点的运行详情页面，单击“继续运行”。在弹出的窗口中，单击“确定”，工作流会开始继续运行。当工作流运行到“服务部署”节点，状态会变为“等待

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard自动学习
使用前必读 - AI开发平台ModelArts

K供您使用，SDK的使用方法请参见ModelArts SDK参考。终端节点终端节点（Endpoint）即调用API的请求地址，不同服务不同区域的终端节点不同，您可以从地区和终端节点中查询所有服务的终端节点。约束与限制您能创建的ModelArts资源的数量与配额有关系，具体请参见服务配额。

帮助中心 > AI开发平台ModelArts > API参考
新建Workflow工作流 - AI开发平台ModelArts

objects 节点的输入项。 outputs 否 Array of JobOutput objects 节点的输出项。 created_at 否 String 节点的创建时间。 title 否 String 工作流节点标题。 description 否 String 节点的描述信息。

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
专属资源池计费项 - AI开发平台ModelArts

计算资源专属资源池使用计算资源的用量。具体费用可参见ModelArts价格详情。按需计费规格单价 * 计算节点个数 * 使用时长包年/包月规格单价 * 计算节点个数 * 购买时长计费示例以下案例中出现的资源规格和费用价格仅供参考，实际价格请参见各服务价格详情。示例：

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
什么是区域、可用区？ - AI开发平台ModelArts

如果您的应用要求实例之间的网络延时较低，则建议您将资源创建在同一可用区内。区域和终端节点当您通过API使用资源时，您必须指定其区域终端节点。有关华为云的区域和终端节点的更多信息，请参阅地区和终端节点。父主题：一般性问题

 帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题

总条数： 1084

上一页
1
...
26
27
28
...
55
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

简介 - AI开发平台ModelArts

自定义脚本代码示例 - AI开发平台ModelArts

更新Workflow Execution - AI开发平台ModelArts

修改在线服务配置 - AI开发平台ModelArts

查询服务日志 - AI开发平台ModelArts

管理Workflow StepExecution - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

管理Workflow Execution - AI开发平台ModelArts

管理AI Gallery模型 - AI开发平台ModelArts

计算规格说明 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

使用大模型在ModelArts Standard创建AI应用部署在线服务 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

使用前必读 - AI开发平台ModelArts

新建Workflow工作流 - AI开发平台ModelArts

专属资源池计费项 - AI开发平台ModelArts

什么是区域、可用区？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线