搜索_华为云

IEF节点边缘服务部署失败 - AI开发平台ModelArts

点，就需要用户给ModelArts的委托赋予Tenant Administrator权限，否则将无法成功部署边缘服务。具体可参见IEF的权限说明。处理方法1 在ModelArts管理控制台，选择“权限管理”。在用户名对应的“授权内容”列，单击“查看权限”，确认用户的委托权限是否已包含Tenant

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
基于MindSpore Lite的模型转换 - AI开发平台ModelArts

模型准备 MindSpore Lite提供的模型convertor工具可以支持主流的模型格式到MindIR的格式转换，用户需要导出对应的模型文件，推荐导出为ONNX格式。如何导出ONNX模型 PyTorch转ONNX，操作指导请见此处。 PyTorch导出ONNX模型样例如下： import

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配
训练作业运行失败，出现NCCL报错 - AI开发平台ModelArts

connect returned Connection refused, retrying”，则表示NCCL无法找到通信网卡或者是无法正常访问IP地址。需要排查训练代码中是否有设置NCCL_SOCKET_IFNAME环境变量，该环境变量由系统自动注入，训练代码中无需设置。训练代码

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

M、Yi、Baichuan等推理部署的详细过程，利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬件，为用户提供推理部署方案，帮助用户使能大模型业务。本方案目前仅适用于部分企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。约束限制本方案目前仅适用于部分企业客户。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
示例：创建DDP分布式训练（PyTorch+NPU） - AI开发平台ModelArts

度权限。同时，训练作业要满足如下要求才能正常实现ranktable动态路由加速。训练使用的Python版本是3.7或3.9。训练作业的实例数要大于或等于3。路由加速的原理是改变rank编号，所以代码中对rank的使用要统一。将训练作业完成如下修改后，启动训练作业即可实现网络加速。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
动态shape - AI开发平台ModelArts
动态shape - AI开发平台ModelArts

动态shape 在某些推理场景中，模型输入的shape可能是不固定的，因此需要支持用户指定模型的动态shape，并能够在推理中接收多种shape的输入。在CPU上进行模型转换时无需考虑动态shape问题，因为CPU算子支持动态shape；而在Ascend场景上，算子需要指定具体的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配
给子账号配置开发环境基本使用权限 - AI开发平台ModelArts

rainJob”为项目级云服务、“trainJobobs”为全局级云服务。了解更多创建用户组并加入用户，步骤请参考Step1 创建用户组并加入用户。给用户组授权策略。在IAM服务的用户组列表页面，单击“授权”，进入到授权页面，为子账号配置权限。勾选“notebook”、“notebook-obs”、“SWR

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
创建算法 - AI开发平台ModelArts
创建算法 - AI开发平台ModelArts

在于，镜像是由用户自行选择的。用户可以基于预置框架制作自定义镜像。基于预置框架制作自定义镜像可参考使用基础镜像构建新的训练镜像章节。完全自定义镜像：订阅算法和预置框架涵盖了大部分的训练场景。针对特殊场景，ModelArts支持用户构建自定义镜像用于模型训练。用户遵循Model

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
准备声音分类数据 - AI开发平台ModelArts

Name/data-cat/cat.wav”。上传OBS的操作步骤：执行如下操作，将数据导入到您的数据集中，以便用于模型训练和构建。登录OBS管理控制台，在ModelArts同一区域内创建桶。如果已存在可用的桶，需确保OBS桶与ModelArts在同一区域。参考上传文件，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现声音分类
GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

务，完成资源的申请。步骤1 安装模型安装Megatron-DeepSpeed框架。使用root用户SSH的方式登录GPU裸金属服务器。具体登录方式请参见SSH密钥方式登录裸金属服务器。拉取pytorch镜像，可以选择常用的镜像源进行下载。 docker pull nvcr

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源使用
使用AOM查看Lite Cluster监控指标 - AI开发平台ModelArts

emory等）的使用情况并上报到AOM，用户可直接在AOM上查看默认配置好的基础指标，也支持用户自定义一些指标项上报到AOM查看。此外，还支持在ModelArts Lite Cluster上安装Prometheus开源监控工具，方便用户使用Prometheus工具在Lite C

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理 > 监控Lite Cluster资源
分析ModelArts数据集中的数据特征 - AI开发平台ModelArts

图像色彩的丰富程度”。“物体检测”支持所有的分析指标。目前ModelArts支持的所有分析指标请参见支持分析指标及其说明。数据特征分析登录ModelArts管理控制台，在左侧菜单栏中选择“资产管理>数据集”，进入“数据集”管理页面。选择对应的数据集，单击操作列的“更多 >

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
获取账号名和账号ID - AI开发平台ModelArts

在调用接口的时候，部分请求中需要填入账号名（domain name）和账号ID（domain_id）。获取步骤如下：注册并登录管理控制台。鼠标移动至用户名，在下拉列表中单击“我的凭证”。在“API凭证”页面的查看“账号名”和“账号ID”。图1 获取账号名和ID 父主题：公共参数

 帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
从训练作业中导入模型文件创建模型 - AI开发平台ModelArts

据模型包结构介绍，将推理代码和配置文件上传至模型的存储目录中。确保您使用的OBS目录与ModelArts在同一区域。创建模型操作步骤登录ModelArts管理控制台，在左侧导航栏中选择“模型管理”，进入模型列表页面。单击左上角的“创建模型”，进入“创建模型”页面。在“创建模型”页面，填写相关参数。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
使用AppCode认证鉴权方式进行在线预测 - AI开发平台ModelArts

署模型为在线服务中的“支持APP认证”参数）。对于已部署的在线服务，ModelArts支持修改其配置开启AppCode认证。本文主要介绍如何修改一个已有的在线服务，使其支持AppCode认证并进行在线预测。前提条件提前部署在线服务，具体操作可以参考案例：使用ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
ModelArts中常用概念 - AI开发平台ModelArts

池。 ModelArts Standard默认提供公共资源池。ModelArts Standard专属资源池需单独创建，专属使用，不与其他用户共享。 ModelArts Lite Server和ModelArts Lite Cluster使用的都是专属资源池。 MoXing Mo

帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
推理场景介绍 - AI开发平台ModelArts

Server资源开通，购买Server资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910）
从Manifest文件导入数据到数据集 - AI开发平台ModelArts

确保数据存储的OBS桶与ModelArts在同一区域，并确保用户具有OBS桶的操作权限。文件型数据从Manifest导入操作不同类型的数据集，导入操作界面的示意图存在区别，请参考界面信息了解当前类型数据集的示意图。当前操作指导以图片数据集为例。登录ModelArts管理控制台，在左侧菜单栏中

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集 > 从OBS导入数据到ModelArts数据集
功能总览 - AI开发平台ModelArts
功能总览 - AI开发平台ModelArts

镜像管理 ModelArts为用户提供了多种常见的预置镜像，但是当用户对深度学习引擎、开发库有特殊需求场景的时候，预置镜像已经不能满足用户需求。ModelArts提供自定义镜像功能支持用户自定义运行引擎。 ModelArts底层采用容器技术，自定义镜像指的是用户自行制作容器镜像并在Mo

帮助中心 > AI开发平台ModelArts > 功能总览
监控资源 - AI开发平台ModelArts
监控资源 - AI开发平台ModelArts

监控资源用户可以通过资源占用情况窗口查看计算节点的资源使用情况，最多可显示最近三天的数据。在资源占用情况窗口打开时，会定期向后台获取最新的资源使用率数据并刷新。操作一：如果训练作业使用多个计算节点，可以通过实例名称的下拉框切换节点。操作二：单击图例“cpuUsage”、“g

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡

总条数： 2215

上一页
1
...
51
52
53
...
111
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

IEF节点边缘服务部署失败 - AI开发平台ModelArts

基于MindSpore Lite的模型转换 - AI开发平台ModelArts

训练作业运行失败，出现NCCL报错 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

示例：创建DDP分布式训练（PyTorch+NPU） - AI开发平台ModelArts

动态shape - AI开发平台ModelArts

给子账号配置开发环境基本使用权限 - AI开发平台ModelArts

创建算法 - AI开发平台ModelArts

准备声音分类数据 - AI开发平台ModelArts

GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

使用AOM查看Lite Cluster监控指标 - AI开发平台ModelArts

分析ModelArts数据集中的数据特征 - AI开发平台ModelArts

获取账号名和账号ID - AI开发平台ModelArts

从训练作业中导入模型文件创建模型 - AI开发平台ModelArts

使用AppCode认证鉴权方式进行在线预测 - AI开发平台ModelArts

ModelArts中常用概念 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

从Manifest文件导入数据到数据集 - AI开发平台ModelArts

功能总览 - AI开发平台ModelArts

监控资源 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线