搜索_华为云

分离部署推理服务 - AI开发平台ModelArts

USE_OPENAI：仅在服务入口实例生效，用于配置api-server服务是否使用openai服务，默认为1。当配置为1时，启动服务为openai服务；当配置为0时，启动服务为vllm服务。其中常见的参数如下： --host：服务部署的IP --port：服务部署的端口，注意如果不

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
创建IAM用户并授权使用ModelArts - AI开发平台ModelArts

CES云监控授予子用户使用CES云监控服务的权限。通过CES云监控可以查看ModelArts的在线服务和对应模型负载运行状态的整体情况，并设置监控告警。 CES FullAccess 可选 SMN消息服务授予子用户使用SMN消息服务的权限。SMN消息通知服务配合CES监控告警功能一起使用。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作 > 配置ModelArts Standard访问授权
训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

“nvidia-smi”是一个NVIDIA GPU监视器命令行工具，用于查看GPU的使用情况和性能指标，可以帮助用户进行GPU优化和故障排除。但是建议在业务软件或训练算法中，避免频繁使用“nvidia-smi”命令功能获取相关信息，存在锁死的风险。出现D+进程后可以尝试如下方法：方法1：可以根据ps

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
分离部署推理服务 - AI开发平台ModelArts

USE_OPENAI：仅在服务入口实例生效，用于配置api-server服务是否使用openai服务，默认为1。当配置为1时，启动服务为openai服务；当配置为0时，启动服务为vllm服务。其中常见的参数如下： --host：服务部署的IP --port：服务部署的端口，注意如果不

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

推理业务迁移到昇腾的通用流程，可参考GPU推理业务迁移至昇腾的通用指导。由于Huggingface网站的限制，访问Stable Diffusion链接时需使用代理服务器，否则可能无法访问网站。在Stable Diffusion迁移适配时，更多的时候是在适配Diffusers和Stable Diffusion

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
新建Workflow工作流 - AI开发平台ModelArts

with_subscription 否 Boolean 工作流SMN消息订阅开关，默认为false，表示关闭消息订阅开关。 smn_switch 否 Boolean SMN开关。 subscription_id 否 String SMN消息订阅ID。 exeml_template_id 否 String

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
查询网络资源 - AI开发平台ModelArts

0/12~24 192.168.0.0/16~24。 connection NetworkConnection object 当前网络与其他云服务的连通信息。表7 NetworkConnection 参数参数类型描述 peerConnectionList Array of peerConnectionList

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
删除网络资源 - AI开发平台ModelArts

0/12~24 192.168.0.0/16~24。 connection NetworkConnection object 当前网络与其他云服务的连通信息。表7 NetworkConnection 参数参数类型描述 peerConnectionList Array of peerConnectionList

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
更新训练作业描述 - AI开发平台ModelArts

job_id 是 Long 训练作业的ID。请求消息请求消息如表2所示。表2 请求参数参数是否必选参数类型说明 job_desc 是 String 对训练作业的描述，字符串的长度限制为[0, 256]。响应消息响应参数如表3所示。表3 响应参数参数参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
使用SDK调测多机分布式训练作业 - AI开发平台ModelArts

"value": 2}) # 启动脚本以parser.add_argument('--dist', action='store_true')的形式来接收该布尔类型的参数，如果要传入True，则以本行代码的形式传递； parameters.append({"name": "dist"}) estimator

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业 > 训练作业调测
Open-Sora 1.0基于DevServer适配PyTorch NPU训练指导（6.3.905） - AI开发平台ModelArts

pytorch_2.1.0 获取软件和镜像表2 获取软件和镜像分类名称获取路径插件代码包 AscendCloud-3rdAIGC-6.3.905-xxx.zip 文件名中的xxx表示具体的时间戳，以包名的实际时间为准。获取路径：Support-E 如果没有软件下载权限，请联系您所在企业的华为方技术支持下载获取。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
推理场景介绍 - AI开发平台ModelArts

适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬件，为用户提供推理部署方案，帮助用户使能大模型业务。约束限制本方案目前仅适用于部分企业客户。本文档适配昇腾云ModelArts 6.3.909版本，请参考软件配套版本获取配套版本的软件包，请严格遵照版本配套关系使用本文档。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
查看在线服务详情 - AI开发平台ModelArts

查看在线服务详情当模型部署为在线服务成功后，您可以进入“在线服务”页面，来查看服务详情。登录ModelArts管理控制台，在左侧菜单栏中选择“模型部署 > 在线服务”，进入“在线服务”管理页面。单击目标服务名称，进入服务详情页面。您可以查看服务的“名称”、“状态”等信息，详情说明请参见表1。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
查询模型runtime - AI开发平台ModelArts

04-x86_64 request_mode Array of strings 请求模式，AI引擎支持部署为同步在线服务或异步在线服务。 sync：同步在线服务 async：异步在线服务 accelerators Array of Accelerator objects AI引擎可使用的加速卡。

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
部署推理服务 - AI开发平台ModelArts

会有损失。如果需要增加模型量化功能，启动推理服务前，先参考使用AWQ量化或使用SmoothQuant量化章节对模型做量化处理。启动服务与请求。此处提供vLLM服务API接口启动和OpenAI服务API接口启动2种方式。详细启动服务与请求方式参考：https://docs.vllm

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907）
场景描述 - AI开发平台ModelArts
场景描述 - AI开发平台ModelArts

体情况，并设置监控告警。 CES FullAccess 可选 SMN消息服务授予子账号使用SMN消息服务的权限。SMN消息通知服务配合CES监控告警功能一起使用。 SMN FullAccess 可选 VPC虚拟私有云子账号在创建ModelArts的专属资源池过程中，如果需要开启自定义网络配置，需要配置VPC权限。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
SDXL Diffusers框架基于DevServer适配PyTorch NPU推理指导（6.3.902） - AI开发平台ModelArts

on上的DevServer资源和Ascend Snt9B单机单卡。获取软件获取插件代码包ascendcloud-aigc-6.3.902-*.tar.gz文件。获取路径：Support网站。如果没有软件下载权限，请联系您所在企业的华为方技术支持下载获取。 ascendcloud-aigc-6

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
创建并完成图像分类的智能标注任务 - AI开发平台ModelArts

启动智能标注前要保证当前数据集不存在正在进行中的智能标注任务。操作步骤调用认证鉴权接口获取用户的Token。请求消息体： URI格式：POST https://{iam_endpoint}/v3/auth/tokens 请求消息头：Content-Type →application/json 请求Body： {

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
使用MaaS压缩模型 - AI开发平台ModelArts

选择是否打开“事件通知”开关。开关关闭（默认关闭）：表示不启用消息通知服务。开关打开：表示订阅消息通知服务，当任务发生特定事件（如任务状态变化或疑似卡死）时会发送通知。此时必须配置“主题名”和“事件”。 “主题名”：事件通知的主题名称。单击“创建主题”，前往消息通知服务中创建主题。 “事件”：选择要订阅的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
推理场景介绍 - AI开发平台ModelArts

适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬件，为用户提供推理部署方案，帮助用户使能大模型业务。约束限制本方案目前仅适用于部分企业客户。本文档适配昇腾云ModelArts 6.3.910版本，请参考软件配套版本获取配套版本的软件包，请严格遵照版本配套关系使用本文档。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）

总条数： 1621

上一页
1
...
16
17
18
...
82
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

分离部署推理服务 - AI开发平台ModelArts

创建IAM用户并授权使用ModelArts - AI开发平台ModelArts

训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

新建Workflow工作流 - AI开发平台ModelArts

查询网络资源 - AI开发平台ModelArts

删除网络资源 - AI开发平台ModelArts

更新训练作业描述 - AI开发平台ModelArts

使用SDK调测多机分布式训练作业 - AI开发平台ModelArts

Open-Sora 1.0基于DevServer适配PyTorch NPU训练指导（6.3.905） - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

查看在线服务详情 - AI开发平台ModelArts

查询模型runtime - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

场景描述 - AI开发平台ModelArts

SDXL Diffusers框架基于DevServer适配PyTorch NPU推理指导（6.3.902） - AI开发平台ModelArts

创建并完成图像分类的智能标注任务 - AI开发平台ModelArts

使用MaaS压缩模型 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线