搜索_华为云

模型推理代码编写说明 - AI开发平台ModelArts

index(max(result[0])) return infer_output 请求 curl -X POST \ 在线服务地址 \ -F images=@test.jpg 返回 {"mnist_result": 7} 在上面的代码示例中，完成了将用户表单输入

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

//docs.vllm.ai/en/latest/getting_started/quickstart.html。以下服务启动介绍的是在线推理方式，离线推理请参见https://docs.vllm.ai/en/latest/getting_started/quickstart

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
advisor调优总体步骤 - AI开发平台ModelArts

advisor调优总体步骤基于ModelArts performance advisor插件的昇腾PyTorch性能调优主要分为以下步骤：准确采集性能劣化时刻的profiling数据。存储profiling数据。创建advisor分析环境。操作步骤明确性能问题类型，准

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
使用MaaS压缩模型 - AI开发平台ModelArts

选择是否打开“事件通知”开关。开关关闭（默认关闭）：表示不启用消息通知服务。开关打开：表示订阅消息通知服务，当任务发生特定事件（如任务状态变化或疑似卡死）时会发送通知。此时必须配置“主题名”和“事件”。 “主题名”：事件通知的主题名称。单击“创建主题”，前往消息通知服务中创建主题。 “事件”：选择要订阅的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
新建Workflow工作流 - AI开发平台ModelArts

dataset：数据集 obs：OBS swr：SWR model_list：AI应用列表 label_task：标注任务 service：在线服务 conditions 否 Array of Constraint objects 数据约束条件。 value 否 Map<String

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
在DevServer上部署SD WebUI推理服务 - AI开发平台ModelArts

在DevServer上部署SD WebUI推理服务本章节主要介绍如何在ModelArts的DevServer环境上部署Stable Diffusion的WebUI套件，使用NPU卡进行推理。步骤一准备环境请参考DevServer资源开通，购买DevServer资源，并确保

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD WEBUI套件适配PyTorch NPU的推理指导（6.3.908）
使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts

使用Gallery CLI配置工具下载文件在服务器（ModelArts Lite云服务器或者是本地Windows/Linux等服务器）上登录Gallery CLI配置工具后，通过命令“gallery-cli download”可以从AI Gallery仓库下载资源。命令说明登录Gallery

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
准备MaaS资源 - AI开发平台ModelArts

准备MaaS资源在使用MaaS服务时，需要先完成OBS桶、资源池等准备工作。准备OBS桶在ModelArts Studio大模型即服务平台创建自定义模型、调优或压缩模型时，需要在对象存储服务OBS中创建OBS桶，用于存放模型权重文件、训练数据集或者是存放永久保存的日志。创

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
裸金属服务器Euler OS升级NetworkManager-config-server导致SSH链接故障解决方案 - AI开发平台ModelArts

service会优先读取网卡配置文件中的IP设置为主机IP，此时无论DH Cient是否关闭，服务器都可以获取分配IP。当服务器没有网卡配置文件时，DH Client开启，此时服务器会分配私有IP。如果关闭DH Client，则服务器无法获取私有IP。图2 查看NetworkManager配置图3

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
ECS获取和上传基础镜像 - AI开发平台ModelArts

ECS获取和上传基础镜像 Step1 创建镜像组织在SWR服务页面创建镜像组织。图1 创建镜像组织 Step2 登录ECS服务器根据创建ECS服务器创建完成ECS服务器后，单击“远程登录”，可使用华为CloudShell远程登录如图所示。后续安装Docker、获取镜像、构建镜像等操作均在该ECS上进行。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作 > 准备镜像
使用AI Gallery SDK构建自定义模型 - AI开发平台ModelArts

性，屏蔽了大量AI模型开发使用过程中的技术细节，并制定了统一合理的规范。使用者可以便捷地使用、下载模型。同时支持用户上传自己的预训练模型到在线模型资产仓库中，并发布上架给其他用户使用。AI Gallery在原有Transformers库的基础上，融入了对于昇腾硬件的适配与支持。对

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
获取Workflow工作流列表 - AI开发平台ModelArts

dataset：数据集 obs：OBS swr：SWR model_list：AI应用列表 label_task：标注任务 service：在线服务 conditions Array of Constraint objects 数据约束条件。 value Map<String,Object>

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
推理精度测试 - AI开发平台ModelArts

为离线测评，不需要启动推理服务，目前支持大语言模型。约束限制确保容器可以访问公网。使用opencompass工具需用vllm接口启动在线服务。当前的精度测试仅适用于语言模型精度验证，不适用于多模态模型的精度验证。多模态模型的精度验证，建议使用开源MME数据集和工具（GitHub

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910）
配置Standard专属资源池可访问公网 - AI开发平台ModelArts

C的方式，使得专属资源池和已绑定EIP的弹性云服务器处于同一VPC内，实现专属资源池访问外网。前提条件已拥有需要部署SNAT的弹性云服务器。待部署SNAT的弹性云服务器操作系统为Linux操作系统。待部署SNAT的弹性云服务器网卡已配置为单网卡。步骤一：打通VPC 通过

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
非分离部署推理服务 - AI开发平台ModelArts

模型建议调大为6000) export HCCL_OP_EXPANSION_MODE=AIV #可选设置动态分档位后，在PTA模式下不支持接收超过最大档的并发请求，超过后会导致推理服务终止。请将最大档（PTA_TORCHAIR_DECODE_GEAR_LIST参数中设置的最大值）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
查询Workflow工作流 - AI开发平台ModelArts

dataset：数据集 obs：OBS swr：SWR model_list：AI应用列表 label_task：标注任务 service：在线服务 conditions Array of Constraint objects 数据约束条件。 value Map<String,Object>

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
推理精度测试 - AI开发平台ModelArts

为离线测评，不需要启动推理服务，目前支持大语言模型。约束限制确保容器可以访问公网。使用opencompass工具需用vllm接口启动在线服务。当前的精度测试仅适用于语言模型精度验证，不适用于多模态模型的精度验证。多模态模型的精度验证，建议使用开源MME数据集和工具（GitHub

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
将模型部署为批量推理服务 - AI开发平台ModelArts

3.5,1.4,0.2 4.9,3.0,1.4,0.2 4.7,3.2,1.3,0.2 根据定义好的映射关系，最终推理请求样例如下所示，与在线服务使用的格式类似： { "data": { "req_data": [{ "input_1": 5.1, "input_2":

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
Function Calling介绍 - AI开发平台ModelArts

Calling能力允许模型调用外部函数或服务，以扩展其自身的能力，执行它本身无法完成的任务。以下是一些Function Calling的使用场景：表1 Function Calling使用场景说明使用场景说明增强能力大模型通过Function Calling可以调用外部工具或服务，例如实时数据检

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 通过Function Calling扩展大语言模型交互能力
模型调试 - AI开发平台ModelArts
模型调试 - AI开发平台ModelArts

训练完成后，可先在开发环境Notebook中创建本地模型，在开发环境Notebook调试完成后再部署到推理服务上。只支持使用ModelArts Notebook部署本地服务。示例代码在ModelArts Notebook平台，Session鉴权无需输入鉴权参数。其它平台的S

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理

总条数： 745

上一页
1
...
17
18
19
...
38
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

模型推理代码编写说明 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

advisor调优总体步骤 - AI开发平台ModelArts

使用MaaS压缩模型 - AI开发平台ModelArts

新建Workflow工作流 - AI开发平台ModelArts

在DevServer上部署SD WebUI推理服务 - AI开发平台ModelArts

使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts

准备MaaS资源 - AI开发平台ModelArts

裸金属服务器Euler OS升级NetworkManager-config-server导致SSH链接故障解决方案 - AI开发平台ModelArts

ECS获取和上传基础镜像 - AI开发平台ModelArts

使用AI Gallery SDK构建自定义模型 - AI开发平台ModelArts

获取Workflow工作流列表 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

配置Standard专属资源池可访问公网 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

查询Workflow工作流 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

将模型部署为批量推理服务 - AI开发平台ModelArts

Function Calling介绍 - AI开发平台ModelArts

模型调试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线