搜索_华为云

Standard资源池 - AI开发平台ModelArts

专属资源池下的在线服务停止后，启动新的在线服务，提示资源不足不同实例的资源池安装的cuda和驱动版本号分别是什么？算法运行时需要依赖鉴权服务，公共资源池是否支持两者打通网络？创建失败的专属资源池删除后，控制台为什么还能看到？训练专属资源池如何与SFS弹性文件系统配置对等链接？

帮助中心 > AI开发平台ModelArts > 常见问题
迁移过程使用工具概览 - AI开发平台ModelArts

自动高性能算子生成工具AKG AKG(Auto Kernel Generator)对深度神经网络中的算子进行优化，并提供特定模式下的算子自动融合功能。提升在昇腾硬件后端上运行网络的性能。 AKG由三个基本的优化模块组成：规范化、自动调度和后端优化。规范化：为了解决poly

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
上传远端文件至JupyterLab - AI开发平台ModelArts

输入有效的远端文件URL后，系统会自动识别上传文件名称，单击“上传”，开始上传文件。图3 输入有效的远端文件URL 图4 远端文件上传成功异常处理远端文件上传失败。可能是网络原因。请先在浏览器中输入该远端文件的URL地址，测试该文件是否能下载。图5 远端文件上传失败父主题：上传文件至JupyterLab

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发 > 上传文件至JupyterLab
使用MoXing时，如何进行增量训练？ - AI开发平台ModelArts

语句中的“logits”，表示根据不同网络中分类层权重的变量名，配置不同的参数。此处填写其对应的关键字。 mox.set_flag('checkpoint_exclude_patterns', 'logits') 如果使用的是MoXing内置网络，其对应的关键字需使用如下API获取

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
迁移评估 - AI开发平台ModelArts
迁移评估 - AI开发平台ModelArts

云服务”模式，客户端请求应答可接受的最长时延为2秒。 - 模型参数规模，是否涉及分布式推理 10B/100B，单机多卡推理。 - 能否提供实际模型、网络验证的代码和数据等信息提供实际模型、网络验证的代码和数据。提供与业务类型类似的开源模型，例如GPT3 10B/13B。提供测试模型以及对应的Demo代码路径（开源或共享）。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
配置Lite Server存储 - AI开发平台ModelArts

存放的是二进制数据，无法直接存放文件，如果需要存放文件，需要先格式化文件系统后使用。访问方式在BMS中通过网络协议挂载使用，支持NFS和CIFS的网络协议。需要指定网络地址进行访问，也可以将网络地址映射为本地目录后进行访问。可以通过互联网或专线访问。需要指定桶地址进行访问，使用的是HTTP和HTTPS等传输协议。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

如果使用DevServer资源，请参考DevServer资源开通，购买DevServer资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.2

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906） > 准备工作
VS Code ToolKit连接Notebook - AI开发平台ModelArts

安装完成后，系统右下角提示安装完成，导航左侧出现ModelArts图标和SSH远程连接图标，表示VS Code插件安装完成。图3 安装完成提示图4 安装完成当前网络不佳时SSH远程连接插件可能未安装成功，此时无需操作，在Step4 连接Notebook实例的1之后，会弹出如下图对话框，单击Install

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

如果使用DevServer资源，请参考DevServer资源开通，购买DevServer资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.2

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905） > 准备工作
使用前必读 - AI开发平台ModelArts

火水电，AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连，以满足用户跨AZ构建高可用性系统的需求。项目区域默认对应一个项目，这个项目由系统预置，用来隔离物理区域间的资源（计算资源、存储资源和网络资源），以默认项目为单位进行授

 帮助中心 > AI开发平台ModelArts > API参考
数据保护技术 - AI开发平台ModelArts

更加安全的HTTPS协议。数据完整性检查推理部署功能模块涉及到的用户模型文件和发布到AIGallery的资产在上传过程中，有可能会因为网络劫持、数据缓存等原因，存在数据不一致的问题。ModelArts提供通过计算SHA256值的方式对上传下载的数据进行一致性校验。数据隔离机制

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
在ModelArts创建分布式训练时如何设置NCCL环境变量？ - AI开发平台ModelArts

系统设置的默认值为3，表示使用RoCE v2协议。 NCCL_IB_TC 系统设置的默认值为128，表示数据包走交换机的队列4，队列4使用PFC流控机制来保证网络是无损的。如果训练时，需要提升通信稳定性，可以增加配置其他NCCL环境变量，如表2所示。表2 建议增加的环境变量环境变量建议值说明

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 创建训练作业
Qwen-VL基于DevServer适配Pytorch NPU的推理指导(6.3.906) - AI开发平台ModelArts

<img>img_path</img>\n{your prompt}，其中id表示对话中的第几张图片。"img_path"可以是本地的图片或网络地址。如果是本地图片，容器需要有权限读取图片。网络图片服务端会自动下载。 messages的样例如下： # body参考 # 图片存放本地示例 { "messages":

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

#执行安装命令 sh scripts/install.sh 在执行 scripts/install.sh 安装命令时，需要确认机器是否已联通网络。若无法联通网络，可使用离线安装的方式，具体参考离线训练安装包准备说明。若要对ChatCLMv3、GLMv4系列模型进行训练时，需要修改 install

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
Standard模型部署 - AI开发平台ModelArts

ModelArts基于Snt3高性能AI推理芯片的深度优化，具有PB级别的单日推理数据处理能力，支持发布云上推理的API百万个以上，推理网络时延毫秒。父主题： Standard功能介绍

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
使用基础镜像 - AI开发平台ModelArts

e.sh 使用基础镜像的方法，需要确认训练作业的资源池是否联通公网，否则执行 install.sh 文件时下载代码会失败。因此可以选择配置网络或使用ECS中构建新镜像的方法。若要对ChatCLMv3、GLMv4系列模型进行训练时，需要修改 install.sh 中的 transformers

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.910） > 准备工作 > 准备镜像
ModelArts支持云审计的关键操作 - AI开发平台ModelArts

DeletePoolV2 更新资源池 PoolV2 UpdatePoolV2 创建网络 NetworksV1 CreateNetworksV1 删除网络 NetworksV1 DeleteNetworksV1 更新网络 NetworksV1 UpdateNetworksV1 父主题：使用CTS审计ModelArts服务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用CTS审计ModelArts服务
使用基础镜像 - AI开发平台ModelArts

sh文件，来安装依赖以及下载完整代码。使用基础镜像的方法，需要确认训练作业的资源池是否联通公网，否则执行 install.sh 文件时下载代码会失败。因此可以选择配置网络或使用ECS中构建新镜像的方法。若要对ChatCLMv3、GLMv4系列模型进行训练时，需要修改 install.sh 中的 transformers

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.910） > 准备工作 > 准备镜像
显存溢出错误 - AI开发平台ModelArts

存溢出的错误。可添加参数：在3_training.sh文件中添加开启重计算的参数。其中recompute-num-layers的值为模型网络中num-layers的参数值。 --recompute-granularity full \ --recompute-method block

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.910） > 常见错误原因和解决方法
显存溢出错误 - AI开发平台ModelArts

存溢出的错误。可添加参数：在3_training.sh文件中添加开启重计算的参数。其中recompute-num-layers的值为模型网络中num-layers的参数值。 --recompute-granularity full \ --recompute-method block

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.910） > 常见错误原因和解决方法

总条数： 470

上一页
1
...
7
8
9
...
24
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Standard资源池 - AI开发平台ModelArts

迁移过程使用工具概览 - AI开发平台ModelArts

上传远端文件至JupyterLab - AI开发平台ModelArts

使用MoXing时，如何进行增量训练？ - AI开发平台ModelArts

迁移评估 - AI开发平台ModelArts

配置Lite Server存储 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

VS Code ToolKit连接Notebook - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

使用前必读 - AI开发平台ModelArts

数据保护技术 - AI开发平台ModelArts

在ModelArts创建分布式训练时如何设置NCCL环境变量？ - AI开发平台ModelArts

Qwen-VL基于DevServer适配Pytorch NPU的推理指导(6.3.906) - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

Standard模型部署 - AI开发平台ModelArts

使用基础镜像 - AI开发平台ModelArts

ModelArts支持云审计的关键操作 - AI开发平台ModelArts

使用基础镜像 - AI开发平台ModelArts

显存溢出错误 - AI开发平台ModelArts

显存溢出错误 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线