搜索_华为云

非分离部署推理服务 - AI开发平台ModelArts

行。开启该功能会略微增加首Token时间，但可以提升推理吞吐量。 export DEFER_MS=10 # 延迟解码时间，默认值为10，单位为ms。将Token解码延迟进行的毫秒数，使得当次Token解码能与下一次模型推理并行计算，从而减少总推理时延。该参数需要设置环境变量DEFER_DECODE=1才能生效。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

from torch.optim.lr_scheduler import StepLR import shutil # 定义网络模型 class Net(nn.Module): def __init__(self): super(Net, self)

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练
GPU A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？ - AI开发平台ModelArts

自检或修复机制，从而恢复了正常的带宽。系统负载问题：最初测试GPU卡间带宽时，可能存在其他系统负载，如进程、服务等，这些负载会占用一部分网络带宽，从而影响NVLINK带宽的表现。重新安装软件后，这些负载可能被清除，从而使NVLINK带宽恢复正常。父主题： Lite Server

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
导出ModelArts数据集中的数据到AI Gallery - AI开发平台ModelArts

根据业务需求和数据集类型选择合适的许可证类型。单击许可证类型后面的感叹号可以查看许可证详情。说明：部分许可证网站说明地址是海外网站，用户可能会因网络限制无法访问。谁可以看设置此数据集的公开权限。可选值有： “公开”：表示所有使用AI Gallery的用户都可以查看且使用该资产。 “

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导出ModelArts数据集中的数据
环境准备 - AI开发平台ModelArts
环境准备 - AI开发平台ModelArts

Standard：在Notebook中，使用预置镜像进行。 ModelArts Lite DevServer：在裸金属服务器中，自助配置好存储、安装固件、驱动、配置网络等。 ModelArts Standard ModelArts上昇腾规格如下。表1 昇腾规格规格名称描述 Ascend 1*ascend-snt9b|ARM

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
创建DevServer - AI开发平台ModelArts

ir_name必须二选一。 name 是 String 服务器名称。 network 是 ServerNetwork object 服务器网络信息。 root_volume 否 EvsVolume object 服务器系统盘信息。 server_type 否 String 服务器类型。枚举值如下：

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
给子账号配置开发环境基本使用权限 - AI开发平台ModelArts

从本地PyCharm查询IAM项目列表，完成连接配置。 VPC接入 VPC VPC ReadOnlyAccess 实例能够挂载在用户的VPC下，实现多网络平面接入。按需配置。创建自定义策略时，建议将项目级云服务和全局级云服务拆分为两条策略，便于授权时设置最小授权范围。委托表2 开发环境所需委托

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

from torch.optim.lr_scheduler import StepLR import shutil # 定义网络模型 class Net(nn.Module): def __init__(self): super(Net, self)

帮助中心 > AI开发平台ModelArts > 快速入门
Step2 为用户配置云服务使用权限 - AI开发平台ModelArts

如果还需要在CES上设置监控告警，则需要再加上CES FullAccess权限，以及SMN消息通知权限。（可选）配置VPC权限。如果用户在创建专属资源池过程中，需要开启自定义网络配置，此处需要授予用户VPC权限。（可选）配置SFS和SFS Turbo权限。如果用户在专属资源池中挂载SFS系统作为开发环境或训练的存储时，需要授予使用权限。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
查看Standard专属资源池详情 - AI开发平台ModelArts

、驱动升级、设置作业类型等操作，不同资源池可进行的操作不一致，具体以控制台显示为准。在“基本信息”的“网络”中，可单击关联的资源池中的数字，查看关联的资源池。可以查看该网络中可用的IP数量。在扩展信息中可以查看监控、作业、节点、规格、事件、标签，详细介绍见下文。查看资源池中的作业

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
Paraformer基于DevServer适配PyTorch NPU推理指导（6.3.911) - AI开发平台ModelArts

步骤一：检查环境请参考DevServer资源开通，购买DevServer资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。购买DevServer资源时如果无可选资源规格，需要联系华为云技术支持申请开通。当容器需要提供服务给多个用户，或者多个用户共享使

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
LLaMA-VID基于DevServer适配PyTorch NPU推理指导（6.3.910) - AI开发平台ModelArts

步骤一检查环境请参考DevServer资源开通，购买DevServer资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。购买DevServer资源时如果无可选资源规格，需要联系华为云技术支持申请开通。当容器需要提供服务给多个用户，或者多个用户共享使

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
SD1.5&SDXL ComfyUI、WebUI、Diffusers套件适配PyTorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

步骤一：准备环境请参考DevServer资源开通，购买DevServer资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。购买DevServer资源时如果无可选资源规格，需要联系华为云技术支持申请开通。当容器需要提供服务给多个用户，或者多个用户共享使

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
Qwen-VL基于DevServer适配Pytorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

Step1 检查环境请参考DevServer资源开通，购买DevServer资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。购买DevServer资源时如果无可选资源规格，需要联系华为云技术支持申请开通。当容器需要提供服务给多个用户，或者多个用户共享使

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

ECS获取和上传基础镜像创建ECS。下文中介绍如何在ECS中构建一个训练镜像，请参考ECS文档购买一个Linux弹性云服务器。完成网络配置、高级配置等步骤，可根据默认选择，或进行自定义。创建完成后，单击“远程登录”，后续安装Docker等操作均在该ECS上进行。注意：C

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 准备工作
简介 - AI开发平台ModelArts
简介 - AI开发平台ModelArts

应用集成。针对转换的模型运行时应用层适配。数据预处理。模型编排。模型裁剪。精度校验。精度对比误差统计工具。自动化精度对比工具。网络结构可视化工具。性能调优。性能测试。性能调优三板斧。性能分析与诊断。迁移测试报告。推理迁移验收表。 ModelArts开发环境

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
更新Notebook实例 - AI开发平台ModelArts

当链接关闭后失效；新打开建立的链接只允许当前设置的IP进行访问。此处的IP地址，请填写外网IP地址。如果用户使用的访问机器和华为云ModelArts服务的网络有隔离，则访问机器的外网地址需要在主流搜索引擎中搜索“IP地址查询”获取，而不是使用ipconfig或ifconfig/ip命令在本地查询。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
推理性能测试 - AI开发平台ModelArts

静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变化时，模型的延迟和吞吐。该场景能模拟实际业务下动态的发送不同长度请求，

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
创建节点池 - AI开发平台ModelArts

Array of UserTag objects 资源标签，非特权池不能指定。 network 否 NodeNetwork object 网络配置，非特权池不能指定。 extendParams 否 Map<String,String> 自定义配置，比如设置节点dockerSize："extendParams":

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
管理Workflow Execution - AI开发平台ModelArts

Workflow工作流配置参数的描述。 example 否 Object Workflow工作流配置参数的样例。 delay 否 Boolean 是否为延迟输入的参数，默认为否。 default 否 Object 配置参数的默认值。 value 否 Object 参数值。 enum 否 Array

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理

总条数： 390

上一页
1
...
12
13
14
...
20
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

非分离部署推理服务 - AI开发平台ModelArts

使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

GPU A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？ - AI开发平台ModelArts

导出ModelArts数据集中的数据到AI Gallery - AI开发平台ModelArts

环境准备 - AI开发平台ModelArts

创建DevServer - AI开发平台ModelArts

给子账号配置开发环境基本使用权限 - AI开发平台ModelArts

使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

Step2 为用户配置云服务使用权限 - AI开发平台ModelArts

查看Standard专属资源池详情 - AI开发平台ModelArts

Paraformer基于DevServer适配PyTorch NPU推理指导（6.3.911) - AI开发平台ModelArts

LLaMA-VID基于DevServer适配PyTorch NPU推理指导（6.3.910) - AI开发平台ModelArts

SD1.5&SDXL ComfyUI、WebUI、Diffusers套件适配PyTorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

Qwen-VL基于DevServer适配Pytorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

简介 - AI开发平台ModelArts

更新Notebook实例 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

创建节点池 - AI开发平台ModelArts

管理Workflow Execution - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线