搜索_华为云

推理场景介绍 - AI开发平台ModelArts

Cluster。推荐使用“西南-贵阳一”Region上的资源和Ascend Snt9B。支持的模型列表和权重文件本方案支持vLLM的v0.6.0版本。不同vLLM版本支持的模型列表有差异，具体如表1所示。表1 支持的模型列表和权重获取地址序号模型名称是否支持fp16/bf16推理是否支持W4A16量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

专属资源池驱动版本要求23.0.6。适配的CANN版本是cann_8.0.rc3。支持的模型列表和权重文件本方案支持vLLM的v0.6.0版本。不同vLLM版本支持的模型列表有差异，具体如表1所示。表1 支持的模型列表和权重获取地址序号模型名称是否支持fp16/bf16推理是否支持W4A16量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
查询模型列表 - AI开发平台ModelArts

指定排序字段，可选“create_at”、“model_version”、“model_size”，默认是可选“create_at”。 order 否 String 排序方式，可选“asc”或“desc”，代表递增排序及递减排序，默认是“desc”。 workspace_id 否 String 工作空间ID，默认为“0”。

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本文档中的模型运行环境是ModelArts Lite Server。镜像适配的Cann版本是cann_8.0.rc2。确保容器可以访问公网。训练支持的模型列表本方案支持以下模型的训练，如表1所示。表1 支持的模型序号支持模型支持模型参数量 1 llama2 llama2-7b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.905）
使用CES监控Lite Server资源 - AI开发平台ModelArts

容器共享内存过小共享内存默认为64M，可按需修改分布式训练时共享内存不足导致训练失败 - 方式一：修改/etc/docker/daemon.json配置文件default-shm-size字段方式二： docker run 命令中使用 --shm-size 参数来设置单个容器的共享内存大小

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源
推理业务迁移评估表 - AI开发平台ModelArts

运行环境：6348（单核48U超线程）性能指标：QPS 10/s（四进程）性能约束：单次请求最大可以接受时延需小于1s 性能预期：QPS 20/s - 业务访问方式推理业务访问：“客户端 -> 云服务” 或 “云客户端 -> 云服务”。推理业务时延要求，客户端到云服务端到端可接受时延。例如：当前是“客户端

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

专属资源池驱动版本要求23.0.6。适配的CANN版本是cann_8.0.rc3。支持的模型列表和权重文件本方案支持vLLM的v0.6.3版本。不同vLLM版本支持的模型列表有差异，具体如表1所示。表1 支持的模型列表和权重获取地址序号模型名称是否支持fp16/bf16推理是否支持W4A16量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
变更计费模式 - AI开发平台ModelArts

图1 转包周期选择弹性集群的购买时长，判断是否勾选“自动续费”，确认预计到期时间和配置费用后单击“去支付”。进入支付页面，选择支付方式，确认付款，支付订单后即可完成按需转包年/包月。

帮助中心 > AI开发平台ModelArts > 计费说明
ModelArts支持云审计的关键操作 - AI开发平台ModelArts

startOrStopService 启停边缘服务节点 service startOrStopNodesService 添加用户访问密钥 service addAkSk 删除用户访问密钥 service deleteAkSk 创建专属资源池 cluster createCluster 删除专属资源池

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用CTS审计ModelArts服务
在模型广场查看模型 - AI开发平台ModelArts

Studio大模型即服务平台提供了丰富的开源大模型，在模型详情页可以查看模型的详细介绍，根据这些信息选择合适的模型进行训练、推理，接入到企业解决方案中。访问模型广场登录ModelArts管理控制台。在左侧导航栏中，选择“ModelArts Studio”进入ModelArts Studio大模型即服务平台。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
在Notebook上安装配置Grafana - AI开发平台ModelArts

g.py”文件中已有“c.ServerProxy.servers”字段，新增对应的key-value键值对即可。适配JupyterLab访问地址。在左侧导航打开“ vi /home/ma-user/work/grf/grafana-9.1.6/conf/defaults.ini”文件。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控 > 使用Grafana查看AOM中的监控指标 > 安装配置Grafana
ECS获取和上传基础镜像 - AI开发平台ModelArts

#检查docker是否安装如尚未安装，运行以下命令安装docker。 yum install -y docker 配置IP转发，用于容器内的网络访问。执行以下命令查看net.ipv4.ip_forward配置项的值，如果为1，可跳过此步骤。 sysctl -p | grep net.ipv4

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作 > 准备镜像
迁移评估 - AI开发平台ModelArts
迁移评估 - AI开发平台ModelArts

运行环境：6348（单核48U超线程）性能指标：QPS 10/s（四进程）性能约束：单次请求最大可以接受时延需小于1s 性能预期：QPS 20/s - 业务访问方式推理业务访问：“客户端 -> 云服务” 或 “云客户端 -> 云服务”。推理业务时延要求，客户端到云服务端到端可接受时延。例如：当前是“客户端

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本文档中的模型运行环境是ModelArts Lite Server。镜像适配的Cann版本是cann_8.0.rc2。确保容器可以访问公网。 Server驱动版本要求23.0.5 训练支持的模型列表本方案支持以下模型的训练，如表1所示。表1 支持的模型列表及权重文件地址

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907）
审计与日志 - AI开发平台ModelArts

startOrStopService 启停边缘服务节点 service startOrStopNodesService 添加用户访问密钥 service addAkSk 删除用户访问密钥 service deleteAkSk 创建专属资源池 cluster createCluster 删除专属资源池

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
Notebook的自定义镜像制作方法 - AI开发平台ModelArts

制作自定义镜像。场景三：通过预置的镜像创建Notebook实例，在预置镜像上安装对应的自定义软件和依赖，进而将运行的实例环境以容器镜像的方式保存下来。具体案例参考在Notebook中通过镜像保存功能制作自定义镜像。 Notebook自定义镜像规范制作自定义镜像时，Base镜像需满足如下规范：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于创建Notebook
查询模型对象列表 - AI开发平台ModelArts

指定排序字段，可选“create_at”、“model_version”、“model_size”，默认是可选“create_at”。 order 否 String 排序方式，可选“asc”或“desc”，代表递增排序及递减排序，默认是“desc”。 workspace_id 否 String 工作空间ID，默认为“0”。

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

完成资源的申请。步骤1 安装模型安装Megatron-DeepSpeed框架。使用root用户SSH的方式登录GPU裸金属服务器。具体登录方式请参见SSH密钥方式登录裸金属服务器。拉取pytorch镜像，可以选择常用的镜像源进行下载。 docker pull nvcr.

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源使用
创建Workflow服务部署节点 - AI开发平台ModelArts

服务部署相关配置信息是 ServiceConfig 表4 ServiceConfig 属性描述是否必填数据类型 infer_type 推理方式：取值可为real-time/batch/edge。默认为real-time。 real-time代表在线服务，将模型部署为一个Web Service。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
自动续费 - AI开发平台ModelArts
自动续费 - AI开发平台ModelArts

在续费管理页面修改自动续费进入“费用中心 > 续费管理”页面。选择需要修改自动续费的专属资源池，单击操作列“修改自动续费”。设置续费方式，选择续费时长，并根据需要设置自动续费次数，单击“确认”。父主题：续费

 帮助中心 > AI开发平台ModelArts > 计费说明 > 续费

总条数： 2146

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

查询模型列表 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

使用CES监控Lite Server资源 - AI开发平台ModelArts

推理业务迁移评估表 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

变更计费模式 - AI开发平台ModelArts

ModelArts支持云审计的关键操作 - AI开发平台ModelArts

在模型广场查看模型 - AI开发平台ModelArts

在Notebook上安装配置Grafana - AI开发平台ModelArts

ECS获取和上传基础镜像 - AI开发平台ModelArts

迁移评估 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

审计与日志 - AI开发平台ModelArts

Notebook的自定义镜像制作方法 - AI开发平台ModelArts

查询模型对象列表 - AI开发平台ModelArts

GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

创建Workflow服务部署节点 - AI开发平台ModelArts

自动续费 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线