搜索_华为云

推理场景介绍 - AI开发平台ModelArts

llama-7b √ https://huggingface.co/huggyllama/llama-7b 2 llama-13b √ https://huggingface.co/huggyllama/llama-13b 3 llama-65b √ https://huggingface

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.905）
更新开发环境实例信息 - AI开发平台ModelArts

链接仓库协议。当前支持：ssh，https。 url String 链接仓库地址。 credential Object 证书信息，请参见表30。表24 credential字段数据结构说明参数参数类型说明 ssh_private_key String ssh私有证书。 access_token

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
pipeline应用准备 - AI开发平台ModelArts

由于欧拉源上没有git-lfs包，所以需要从压缩包中解压使用，在浏览器中输入如下地址下载git-lfs压缩包并上传到服务器的/home目录。 https://github.com/git-lfs/git-lfs/releases/download/v3.2.0/git-lfs-linux-arm64-v3

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
推理场景介绍 - AI开发平台ModelArts

√ √ https://huggingface.co/huggyllama/llama-7b 2 llama-13b √ √ √ √ https://huggingface.co/huggyllama/llama-13b 3 llama-65b √ √ √ √ https://huggingface

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906）
训练作业进程被kill - AI开发平台ModelArts

CPU软锁在解压大量文件可能会出现此情况并造成节点重启。可以适当在解压大量文件时，加入sleep。比如每解压1w个文件，就停止1s。存储限制根据规格情况合理使用数据盘，数据盘大小请参考训练环境中不同规格资源大小。 CPU过载减少线程数。排查办法根据错误信息判断，报错原因来源于用户代码。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
推理精度测试 - AI开发平台ModelArts

推理精度测试本章节介绍如何使用opencompass工具开展语言模型的推理精度测试，数据集是ceval_gen、mmlu_gen、math_gen、gsm8k_gen、humaneval_gen。约束限制确保容器可以访问公网。当前的精度测试仅适用于语言模型精度验证，不适用

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909）
创建开发环境实例 - AI开发平台ModelArts

链接仓库协议。当前支持：ssh，https。 url String 链接仓库地址。 credential Object 证书信息，请参见表30。表30 credential字段数据结构说明参数参数类型说明 ssh_private_key String ssh私有证书。 access_token

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
Open-Clip基于DevServer适配PyTorch NPU训练指导 - AI开发平台ModelArts

0.]]。 Step8 精度评估关闭数据集shuffle，保证训练数据一致。修改/home/ma-user/open_clip/src/training/data.py文件，搜索get_wds_dataset函数，将两处shuffle关闭，修改代码如下。 if is_train:

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

# eagle投机对基于 https://github.com/SafeAILab/EAGLE/ 版本实现 xport ENABLE_SPEC_METRIC=0 # 是否关闭投机推理的metric采集功能，关闭有助于提升投机推理性能，默认关闭如果需要使用eagle投机推理功能，需要进入

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
服务预测失败，报错APIG.XXXX - AI开发平台ModelArts

G.0201”:“Request entity too large”。请减少预测请求内容后重试。当使用API调用地址预测时，请求体的大小限制是12MB，超过12MB时，请求会被拦截。使用ModelArts console的预测页签进行的预测，由于console的网络链路的不同，要求请求体的大小不超过8MB。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
通过运行的实例保存成容器镜像 - AI开发平台ModelArts

该镜像所对应的描述信息，长度限制512个字符。 name 否 String 镜像名称，长度限制512个字符，支持小写字母、数字、中划线、下划线和点。 namespace 否 String 镜像所属组织，可以在SWR控制台“组织管理”创建和查看。 tag 否 String 镜像tag，长度限制64个字

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
删除镜像 - AI开发平台ModelArts
删除镜像 - AI开发平台ModelArts

description String 该镜像所对应的描述信息，长度限制512个字符。 dev_services Array of strings 镜像支持的服务。枚举值如下： NOTEBOOK：镜像支持通过https协议访问Notebook。 SSH：镜像支持本地IDE通过SSH协议远程连接Notebook。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
托管镜像到AI Gallery - AI开发平台ModelArts

文件上传完成前，请不要刷新或关闭上传页面，防止意外终止上传任务，导致数据缺失。当文件状态变成“上传成功”表示数据文件成功上传至AI Gallery仓库进行托管。单击“完成”返回镜像文件页面。图1 上传成功文件上传过程中请耐心等待，不要关闭当前上传页面，关闭页面会中断上传进程。父主题：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery镜像
推理场景介绍 - AI开发平台ModelArts

√ √ https://huggingface.co/huggyllama/llama-7b 2 llama-13b √ √ √ √ https://huggingface.co/huggyllama/llama-13b 3 llama-65b √ √ √ √ https://huggingface

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907）
查询镜像详情 - AI开发平台ModelArts

description String 该镜像所对应的描述信息，长度限制512个字符。 dev_services Array of strings 镜像支持的服务。枚举值如下： NOTEBOOK：镜像支持通过https协议访问Notebook。 SSH：镜像支持本地IDE通过SSH协议远程连接Notebook。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
更新训练作业描述 - AI开发平台ModelArts

对训练作业的描述，默认为“NULL”，字符串的长度限制为[0, 256]。响应参数无请求示例如下以修改uuid为3faf5c03-aaa1-4cbe-879d-24b05d997347的训练作业为例。修改成功后再调用查询训练作业接口即可看到description已被修改。 PUT https://endpo

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
通过Token认证的方式访问在线服务 - AI开发平台ModelArts

方式三：使用Python语言发送预测请求。方式四：使用Java语言发送预测请求。约束限制调用API访问在线服务时，对预测请求体大小和预测时间有限制：请求体的大小不超过12MB，超过后请求会被拦截。因APIG（API网关）限制，平台每次请求预测的时间不超过40秒。前提条件已经获取用户Tok

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
查询工作空间配额 - AI开发平台ModelArts

String 数量单位(英文)。 used_quota Integer 已用配额值。当quota为-1（不限制配额）时，used_quota为null。请求示例 GET https://{endpoint}/v1/{project_id}/workspaces/ccd05d1a55

帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
更新训练作业描述 - AI开发平台ModelArts

请求消息请求消息如表2所示。表2 请求参数参数是否必选参数类型说明 job_desc 是 String 对训练作业的描述，字符串的长度限制为[0, 256]。响应消息响应参数如表3所示。表3 响应参数参数参数类型描述 is_success Boolean 请求是否成功。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
训练迁移快速入门案例 - AI开发平台ModelArts

具体案例直接实操，请参考《主流开源大模型基于DevServer适配PyTorch NPU训练指导》。该案例以ChatGLM-6B为例，介绍如何将模型迁移至昇腾设备上训练、模型精度对齐以及性能调优。迁移环境准备本文以弹性裸金属作为开发环境。弹性裸金属支持深度自定义环境安装，可以

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导

总条数： 1195

上一页
1
...
22
23
24
...
60
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理场景介绍 - AI开发平台ModelArts

更新开发环境实例信息 - AI开发平台ModelArts

pipeline应用准备 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

训练作业进程被kill - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

创建开发环境实例 - AI开发平台ModelArts

Open-Clip基于DevServer适配PyTorch NPU训练指导 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

服务预测失败，报错APIG.XXXX - AI开发平台ModelArts

通过运行的实例保存成容器镜像 - AI开发平台ModelArts

删除镜像 - AI开发平台ModelArts

托管镜像到AI Gallery - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

查询镜像详情 - AI开发平台ModelArts

更新训练作业描述 - AI开发平台ModelArts

通过Token认证的方式访问在线服务 - AI开发平台ModelArts

查询工作空间配额 - AI开发平台ModelArts

更新训练作业描述 - AI开发平台ModelArts

训练迁移快速入门案例 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线