搜索_华为云

在推理生产环境中部署推理服务 - AI开发平台ModelArts

钟。此处仅介绍关键参数，更多详细参数解释请参见部署在线服务。图3 部署在线服务单击“下一步”，再单击“提交”，开始部署服务，待服务状态显示“正常”服务部署完成。图4 服务部署完成 Step4 调用在线服务进入在线服务详情页面，选择“预测”，设置请求路径：“/generat

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
调用ModelArts API接口创建训练作业和部署服务时，如何填写资源池的参数？ - AI开发平台ModelArts

调用ModelArts API接口创建训练作业和部署服务时，如何填写资源池的参数？调用API接口创建训练作业时，“pool_id”为“资源池ID”。调用API接口部署在线服务时，“pool_name”为“资源池ID” 。图1 资源池ID 父主题： API/SDK

帮助中心 > AI开发平台ModelArts > 常见问题 > API/SDK
自定义镜像规范 - AI开发平台ModelArts

Infer_port 选填，推理服务提供的端口，缺省值为8080。只支持部署HTTP服务。自定义镜像可以通过是否上传自定义推理参数文件“gallery_inference/inference_params.json”决定镜像在部署推理服务时是否支持设置推理参数。如果在自定义镜像的“模型文件”下

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
查询Workflow工作流 - AI开发平台ModelArts

描述 name String 工作流存储的名称。填写1-64位，只包含英文、数字、下划线（_）和中划线（-），并且以英文开头的名称。 type String 工作流存储的类型，当前只支持obs。 path String 统一存储的根路径，当前只支持OBS路径。表16 WorkflowAsset

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

单击左上角返回在线服务，在对应的服务名称所在行，单击选择操作列的“更多>停止”，停止该服务。图7 停止服务清除OBS中的数据。在控制台左侧导航栏的服务列表，选择“对象存储服务OBS”，进入OBS服务详情页面。在左侧导航栏选择“桶列表”，在列表详情，找到自己创建的OBS桶，单击桶名称，进入OBS桶详情。

帮助中心 > AI开发平台ModelArts > 快速入门
使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

单击左上角返回在线服务，在对应的服务名称所在行，单击选择操作列的“更多>停止”，停止该服务。图7 停止服务清除OBS中的数据。在控制台左侧导航栏的服务列表，选择“对象存储服务OBS”，进入OBS服务详情页面。在左侧导航栏选择“桶列表”，在列表详情，找到自己创建的OBS桶，单击桶名称，进入OBS桶详情。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard自动学习
在ModelArts Standard上运行GPU单机多卡训练作业 - AI开发平台ModelArts

ing”也请替换为自定义的值。选择左侧导航栏的“总览”，单击页面右上角的“登录指令”，在弹出的页面中单击复制登录指令。此处生成的登录指令有效期为24小时，如果需要长期有效的登录指令，请参见获取长期有效登录指令。获取了长期有效的登录指令后，在有效期内的临时登录指令仍然可以使用。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
GPU A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？ - AI开发平台ModelArts

A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？场景描述本文指导如何进行节点内NVLINK带宽性能测试，适用的环境为：Ant8或者Ant1 GPU裸金属服务器，且服务器中已经安装相关GPU驱动软件，以及Pytorch2.0。 GPU A系列裸金属服务器，单台服务

 帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
Step2 为用户配置云服务使用权限 - AI开发平台ModelArts

Step2 为用户配置云服务使用权限主用户为子账号授予ModelArts、OBS等云服务的使用权限后，子账号才可以使用这些云服务。此步骤介绍如何为用户组中的所有子账号授予使用ModelArts、OBS、SWR等各类云服务的权限。主用户在IAM服务的用户组列表页面，单击“授权”，进入到授权页面，为子账号配置权限。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
推理部署使用场景 - AI开发平台ModelArts

AI模型开发完成后，在ModelArts服务中可以将AI模型创建为模型，将模型快速部署为推理服务，您可以通过调用API的方式把AI推理能力集成到自己的IT平台，或者批量生成推理结果。图1 推理简介训练模型：可以在ModelArts服务中进行，也可以在您的本地开发环境进行，本地开发的模型需要上传到华为云OBS服务。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
步骤总览 - AI开发平台ModelArts
步骤总览 - AI开发平台ModelArts

多机多卡资源购买：购买虚拟私有云VPC 购买弹性文件服务SFS 购买对象存储服务OBS 购买容器镜像服务SWR 创建网络购买ModelArts专属资源池购买弹性云服务器ECS 基本配置：权限配置专属资源池VPC打通 ECS服务器挂载SFS Turbo存储在ECS中创建ma-user和ma-group

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练
准备物体检测数据 - AI开发平台ModelArts

Browser+上传数据或上传文件夹。上传的数据需满足此类型自动学习项目的数据集要求。在上传数据时，请选择非加密桶进行上传，否则会由于加密桶无法解密导致后期的训练失败。用于训练的图片，至少有1种以上的分类，每种分类的图片数不少50张。创建数据集数据准备完成后，需要创建相应项目支持的类型的数据集，具体操作请参考创建ModelArts数据集。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现物体检测
在Lite Cluster资源池上使用Snt9B完成推理任务 - AI开发平台ModelArts

场景描述本案例介绍如何在Snt9B环境中利用Deployment机制部署在线推理服务。首先创建一个Pod以承载服务，随后登录至该Pod容器内部署在线服务，并最终通过新建一个终端作为客户端来访问并测试该在线服务的功能。图1 任务示意图操作步骤拉取镜像。本测试镜像为bert_pret

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
MaaS使用场景和使用流程 - AI开发平台ModelArts

中调用该模型服务进行预测。调用MaaS部署的模型服务免费体验预置服务 ModelArts Studio大模型即服务平台给新用户分配了每个模型100万Tokens的免费调用额度，无需部署即可一键体验通义千问、ChatGLM等预置模型服务。免费体验MaaS预置服务 - 应用体验

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
创建可视化作业 - AI开发平台ModelArts

称。请求消息请求参数如表2所示。表2 请求参数参数是否必选参数类型说明 job_name 是 String 可视化作业名称。限制为1-20位只含数字，字母，下划线，中划线的名称。 job_desc 否 String 对可视化作业的描述，默认为空，字符串的长度限制为[0

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
停止计费 - AI开发平台ModelArts
停止计费 - AI开发平台ModelArts

间产生的费用，通常会在10:00左右才进行扣费。对于在线/批量/边缘服务，因资源ID与账单中上报的资源ID不一致，所以需通过如下方法查询账单停止计费：使用公共资源池创建的在线/批量/边缘服务，通过此方式停止服务后，即可停止计费。使用专属资源池创建的在线/批量/边缘服务，需删

 帮助中心 > AI开发平台ModelArts > 计费说明
advisor调优总体步骤 - AI开发平台ModelArts

iling参数，确保能采集到16步的数据。对于所有step稳定劣化的场景，避免采集第一个step的profiling即可，可以采集任意step如第15个step即可。对于偶现且劣化现象出现的step数不固定的场景，则需要确保能采集到该不固定的step。 profiling数据采集请参考Ascend

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
使用Gallery CLI配置工具上传文件 - AI开发平台ModelArts

复制完整资产名称获取待上传的文件名获取待上传的文件在服务器的绝对路径。上传单个文件在服务器执行如下命令，可以将服务器上的文件上传到AI Gallery仓库里面。 gallery-cli upload {repo_id} {文件名} 如下所示，表示将服务器上的文件“D:\workp

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
在ModelArts中调整模型后，部署新版本模型能否保持原API接口不变？ - AI开发平台ModelArts

ModelArts提供多版本支持和灵活的流量策略，您可以通过使用灰度发布，实现模型版本的平滑过渡升级。修改服务部署新版本模型或者切换模型版本时，原服务预测API不会变化。调整模型版本的操作可以参考如下的步骤。前提条件已存在部署完成的服务。已完成模型调整，创建模型。操作步骤

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
准备推理环境 - AI开发平台ModelArts

将权重文件上传到DevServer机器中。权重文件的格式要求为Huggingface格式。开源权重文件获取地址请参见支持的模型列表。如果使用模型训练后的权重文件进行推理，模型训练及训练后的权重文件转换操作可以参考大模型训练相关文档。权重要求放在磁盘的指定目录，并做目录大小检查，参考命令如下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务部署

总条数： 1617

上一页
1
...
18
19
20
...
81
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在推理生产环境中部署推理服务 - AI开发平台ModelArts

调用ModelArts API接口创建训练作业和部署服务时，如何填写资源池的参数？ - AI开发平台ModelArts

自定义镜像规范 - AI开发平台ModelArts

查询Workflow工作流 - AI开发平台ModelArts

使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机多卡训练作业 - AI开发平台ModelArts

GPU A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？ - AI开发平台ModelArts

Step2 为用户配置云服务使用权限 - AI开发平台ModelArts

推理部署使用场景 - AI开发平台ModelArts

步骤总览 - AI开发平台ModelArts

准备物体检测数据 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成推理任务 - AI开发平台ModelArts

MaaS使用场景和使用流程 - AI开发平台ModelArts

创建可视化作业 - AI开发平台ModelArts

停止计费 - AI开发平台ModelArts

advisor调优总体步骤 - AI开发平台ModelArts

使用Gallery CLI配置工具上传文件 - AI开发平台ModelArts

在ModelArts中调整模型后，部署新版本模型能否保持原API接口不变？ - AI开发平台ModelArts

准备推理环境 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线