搜索_华为云

部署模型为在线服务 - AI开发平台ModelArts

在线服务列表页面单击“名称/ID”，进入在线服务详情页面。单击CloudShell页签，选择模型版本和计算节点，当连接状态变为时，即登录实例容器成功。如果遇到异常情况服务器主动断开或超过10分钟未操作自动断开，此时可单击“重新连接”重新登录实例容器。图5 CloudShell界面部分用户登录Cloud Sh

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
在推理生产环境中部署推理服务 - AI开发平台ModelArts

在推理生产环境中部署推理服务本章节介绍如何在ModelArts的推理生产环境（ModelArts控制台的在线服务功能）中部署推理服务。 Step1 准备模型文件和权重文件在OBS桶中，创建文件夹，准备模型权重文件、推理启动脚本run_vllm.sh及SSL证书。此处以chatglm3-6b为例。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
配置Lite Cluster存储 - AI开发平台ModelArts

载。节点存储。多个容器可能会共享这一个存储，会存在写冲突的问题。 Pod删除后，存储不会清理。使用主机路径 OBS 适用于训练数据集的存储。对象存储。常用OBS SDK进行样本数据下载。存储量大，但是离节点比较远，直接训练速度会比较慢，通常会先将数据拉取到本地cache，然后再进行训练任务。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
给子账号配置开发环境基本使用权限 - AI开发平台ModelArts

Export modelarts:workspace:getQuotas（如果开通了工作空间功能，则需要配置此权限。）从本地VSCode连接云上的Notebook实例、提交训练作业等。按需配置。 OBS obs:bucket:ListAllMybuckets obs:bucket:HeadBucket

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
部署推理服务 - AI开发平台ModelArts

部署推理服务本章节介绍如何使用vLLM 0.3.2框架部署并启动推理服务。前提条件已准备好DevServer环境，具体参考资源规格要求。推荐使用“西南-贵阳一”Region上的DevServer和昇腾Snt9b资源。确保容器可以访问公网。 Step1 检查环境 SSH登录

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.905）
批量添加样本 - AI开发平台ModelArts

cluster_name 否 String MRS集群名称。可登录MRS控制台查看。 database_name 否 String 导入表格数据集，数据库名字。 input 否 String 表格数据集，HDFS路径。例如/datasets/demo。 ip 否 String 用户GaussDB(DWS)集群的IP地址。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
终止训练作业 - AI开发平台ModelArts

ssh SSHResp object SSH连接信息。 jupyter_lab JupyterLab object JupyterLab连接信息。 tensorboard Tensorboard object Tensorboard连接信息。 mindstudio_insight

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
LLaVA-NeXT基于DevServer适配Pytorch NPU训练微调指导（6.3.910） - AI开发平台ModelArts

r资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。购买DevServer资源时如果无可选资源规格，需要联系华为云技术支持申请开通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

Turbo中。而基于SFS Turbo所执行的训练流程如下：将SFS Turbo挂载至ECS服务器后，可直接访问SFS Turbo。通过SSH连接ECS将代码包上传至SFS Turbo中。在表1获取基础镜像，随后通过镜像方案说明中的步骤执行代码包中llm_train/AscendS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

修复。代码上传至OBS 将AscendSpeed代码包AscendCloud-3rdLLM-905-xxx.zip在本地解压缩后，将llm_train文件上传至OBS中。结合准备数据、准备权重、准备代码，将数据集、原始权重、代码文件都上传至OBS后，OBS桶的目录结构如下。 <bucket_name>

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 准备工作
模型的自定义镜像制作流程 - AI开发平台ModelArts

自定义镜像如果需要在“在线服务”模块使用OBS外部存储挂载功能，需要新建一个OBS挂载专属目录如“/obs-mount/”，避免选择存量目录覆盖已有文件。OBS挂载仅开放对挂载目录文件新增、查看、修改功能，如果需要删除文件请到OBS并行文件系统中手动删除。健康检查接口示例如下。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
在开发环境中部署本地服务进行调试 - AI开发平台ModelArts

表3 部署本地服务predictor返回参数说明参数是否必选参数类型描述 predictor 是 Predictor对象 Predictor对象，其属性只包括推理服务测试。父主题：服务管理

 帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务介绍如何在Notebook中配置NPU环境，部署并启动推理服务，完成精度测试和性能测试。如果需要部署量化模型，需在Notebook中进行模型权重转换后再部署推理服务。在推理生产环境中部署推理服务介绍如何在创建AI应用，部署并启动推理服务，在线预测在线服务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务介绍如何在Notebook中配置NPU环境，部署并启动推理服务，完成精度测试和性能测试。如果需要部署量化模型，需在Notebook中进行模型权重转换后再部署推理服务。在推理生产环境中部署推理服务介绍如何在创建AI应用，部署并启动推理服务，在线预测在线服务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
推理场景介绍 - AI开发平台ModelArts

注意：需要修改源文件site-packages/timm/layers/pos_embed.py，在第46行上面新增一行代码，如下： posemb = posemb.contiguous() #新增 posemb = F.interpolate(posemb, size=new_size, mode=interpolation

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910）
上传镜像 - AI开发平台ModelArts
上传镜像 - AI开发平台ModelArts

约束与限制使用客户端上传镜像，镜像的每个layer大小不能大于10G。上传镜像的容器引擎客户端版本必须为1.11.2及以上。操作步骤连接容器镜像服务。登录容器镜像服务控制台。单击右上角“创建组织”，输入组织名称完成组织创建。请自定义组织名称，本示例使用“deep-lea

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
模型训练使用流程 - AI开发平台ModelArts

terLab，无需关注安装配置，即开即用。 ModelArts也提供了本地IDE的方式开发模型，通过开启SSH远程开发，本地IDE可以远程连接到调试训练作业中，进行调试和运行代码。本地IDE方式不影响用户的编码习惯，并且调试完成的代码可以零成本直接创建生产训练作业。支持的本地IDE请参考使用PyCharm

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
AI Gallery的入口在哪里 - AI开发平台ModelArts

AI Gallery的入口在哪里控制台入口登录ModelArts管理控制台。在左侧导航栏中选择“AI Gallery”跳转到AI Gallery首页。直接网址访问旧版AI Gallery将下线，已不再更新，建议使用新版AI Gallery。旧版AI Gallery地址：https://developer

帮助中心 > AI开发平台ModelArts > 常见问题 > AI Gallery
删除训练作业 - AI开发平台ModelArts

id") 方式二：根据创建训练作业生成的训练作业对象删除。 job_instance.delete_job() 参数说明表1 delete_job_by_id请求参数说明参数是否必选参数类型描述 session 是 Object 会话对象，初始化方法请参考Session鉴权。 job_id

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
自动学习使用子账号单击开始训练出现错误Modelarts.0010 - AI开发平台ModelArts

自动学习使用子账号单击开始训练出现错误Modelarts.0010 用主账号给子账号配置ModelArts所使用的OBS桶的ACL权限即可。父主题：模型训练

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 模型训练

总条数： 1617

上一页
1
...
61
62
63
...
81
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

部署模型为在线服务 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

配置Lite Cluster存储 - AI开发平台ModelArts

给子账号配置开发环境基本使用权限 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

批量添加样本 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

LLaVA-NeXT基于DevServer适配Pytorch NPU训练微调指导（6.3.910） - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

模型的自定义镜像制作流程 - AI开发平台ModelArts

在开发环境中部署本地服务进行调试 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

上传镜像 - AI开发平台ModelArts

模型训练使用流程 - AI开发平台ModelArts

AI Gallery的入口在哪里 - AI开发平台ModelArts

删除训练作业 - AI开发平台ModelArts

自动学习使用子账号单击开始训练出现错误Modelarts.0010 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线