搜索_华为云

查询专属资源池列表 - AI开发平台ModelArts

allocatable_memory Integer 可使用的内存数。 cluster_id String 集群ID。 nodes ClusterNode object 集群节点配置。 allocatable_cpu_cores Float 可使用的CPU核数。 product_id String

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
pip介绍及常用命令 - AI开发平台ModelArts

pip install SomePackage #最新版本安装 pip uninstall SomePackage #卸载软件版本其他命令请使用pip --help命令查询。父主题：更多功能咨询

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
发布本地AI应用到AI Gallery - AI开发平台ModelArts

页签的背景图展示在AI应用列表。建议使用16：9的图片，且大小不超过7MB。如果未上传图片，AI Gallery会为AI应用自动生成封面。应用描述否输入AI应用的功能介绍，AI应用创建后，将展示在AI应用页签上，方便其他用户了解与使用。支持0~100个字符。参数填写完

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用
安装ModelArts SDK报错“ERROR: Could not install packages due to an OSError” - AI开发平台ModelArts

-> 'c:\python39\Scripts\ephemeral-port-reserve.exe.deleteme ”。原因分析用户使用权限问题导致。处理方法用户电脑切换到管理员角色，键盘快捷键（Windows+R模式）并输入cmd，进入黑色窗口，执行如下命令： python

帮助中心 > AI开发平台ModelArts > 故障排除 > API/SDK
服务启动后，状态断断续续处于“告警中” - AI开发平台ModelArts

process the new request 原因分析该报错是因为发送预测请求后，服务出现停止后又启动的情况。处理方法需要您检查服务使用的镜像，确定服务停止的原因，修复问题。重新创建AI应用部署服务。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
训练前卡死 - AI开发平台ModelArts

err 129等通信信息时，说明当前网络不是很稳定。解决方案3 可加入3个环境变量。 NCCL_IB_GID_INDEX=3：使用RoCE v2协议，默认使用RoCE v1，但是v1在交换机上没有拥塞控制，可能丢包，而且后面的交换机不会支持v1，就无法启动。 NCCL_IB_TC=

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业卡死
部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

-V)查看该镜像的cuda版本（customize_service.py编写指导请见模型推理代码编写说明）。确认该cuda版本与您安装的mmcv版本是否匹配。部署时是否需要使用GPU，取决于的模型需要用到CPU还是GPU，以及推理脚本如何编写。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
更新节点池 - AI开发平台ModelArts

资源规格名称，比如：modelarts.vm.gpu.t4u8。 count 是 Integer 规格保障使用量。 maxCount 是 Integer 资源规格的弹性使用量，物理池该值和count相同。 azs 否 Array of PoolNodeAz objects 资源池中节点的AZ信息。

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
服务部署失败，报错No Module named XXX - AI开发平台ModelArts

‘model_service.tfserving_model_service’，则需要您在推理代码customize_service.py里使用from model_service.pytorch_model_service import PTServingBaseService。示例代码：

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
按标签名称更新单个标签 - AI开发平台ModelArts

@modelarts:from_type 否 String 内置属性：三元组关系标签的起始实体类型，创建关系标签时必须指定，该参数仅文本三元组数据集使用。 @modelarts:rename_to 否 String 内置属性：重命名后的标签名。 @modelarts:shortcut 否 String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
从DLI导入数据到ModelArts数据集 - AI开发平台ModelArts

表名称：根据选择的数据库展现此数据库中的所有表。请在下拉框中选择您所需的表。 DLI的default队列只用作体验，不同账号间可能会出现抢占的情况，需进行资源排队，不能保证每次都可以得到资源执行相关操作。 DLI支持schema映射的功能，即导入的表的schema的字段名称可以不和数据集相同，但类型要保持一致。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集
查询数据集的标注任务列表 - AI开发平台ModelArts

False：默认值，查询所有标注任务 sort_key 否 String 排序字段。可选值如下： create_time：根据创建时间排序 task_name：根据任务名称进行排序 sort_dir 否 String 排序方式。可选值如下： asc：按照升序排序 desc：默认值，按照降序排序父主题：标注任务管理

 帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 标注任务管理
数据集版本不合格 - AI开发平台ModelArts

物体检测：用于训练的图片，至少有1种以上的分类（即1种以上的标签），每种分类的图片数不少于5张。预测分析：由于预测分析任务的数据集不在数据管理中进行统一管理，即使数据不满足要求，不在此环节出现故障信息。声音分类：用于训练的音频，至少有2种以上的分类（即2种以上的标签），每种分类的音频数不少于5个。

帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 准备数据
如何保证训练和调试时文件路径保持一致 - AI开发平台ModelArts

-s建立软连接如果代码中涉及文件绝对路径，由于Notebook调试与训练作业环境不同，可能会导致文件绝对路径不一致，需要修改代码内容。推荐使用软链接的方式解决该问题，用户只需提前建立好软链接，代码中的地址可保持不变。新建软链接： # ln -s 源目录/文件目标目录/文件 #

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ
执行LoRA微调训练任务 - AI开发平台ModelArts

NODE_RANK=0 sh scripts/llama2/0_pl_lora_13b.sh 如果单机运行需要指定使用NPU卡的数量，可提前定义变量 NPUS_PER_NODE 。例如使用单机四卡训练Llama2-7B命令。 MASTER_ADDR=localhost NNODES=1 NODE_RANK=0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.909）
执行LoRA微调训练任务 - AI开发平台ModelArts

NODE_RANK=0 sh scripts/llama2/0_pl_lora_13b.sh 如果单机运行需要指定使用NPU卡的数量，可提前定义变量 NPUS_PER_NODE 。例如使用单机四卡训练Llama2-7B命令。 MASTER_ADDR=localhost NNODES=1 NODE_RANK=0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908）
管理开发环境实例 - AI开发平台ModelArts

操作开发环境实例，支持： start stop restart queue dequeue 其中，queue和dequeue仅支持对免费资源进行操作。响应消息响应参数如表3所示。表3 响应参数参数参数类型说明 current_status String 实例当前状态。 previous_state

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
变更计费模式概述 - AI开发平台ModelArts

将专属资源池的计费模式从按需计费转为包年/包月，可以让您享受一定程度的价格优惠。将专属资源池的计费模式从包年/包月转为按需计费，可以更加灵活地使用ModelArts计算资源。说明：包年/包月计费模式到期后，按需计费模式才会生效。按需转包年/包月包年/包月转按需父主题：变更计费模式

 帮助中心 > AI开发平台ModelArts > 计费说明 > 变更计费模式
为什么在ModelArts数据标注平台标注数据提示标注保存失败？ - AI开发平台ModelArts

可能是用户本地网络的原因，网速不稳定或者网络配置有问题，均可能导致保存失败。解决方案 1. 切换为稳定的网络后重试。 2. 初始化网络配置，使用管理员权限启动CMD，输入netsh winsock reset指令，完成后重启电脑，再登录数据标注平台重试。父主题： Standard数据管理

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据管理
ModelArts环境挂载目录说明 - AI开发平台ModelArts

rnetes.io/serviceaccount 是 / 训练任务表2 训练任务挂载点介绍挂载点是否只读备注 /xxx 否专属池使用SFS盘挂载的目录，路径由客户自己指定。 /home/ma-user/modelarts 否空文件夹，建议用户主要用这个目录。 /cache

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ

总条数： 1977

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询专属资源池列表 - AI开发平台ModelArts

pip介绍及常用命令 - AI开发平台ModelArts

发布本地AI应用到AI Gallery - AI开发平台ModelArts

安装ModelArts SDK报错“ERROR: Could not install packages due to an OSError” - AI开发平台ModelArts

服务启动后，状态断断续续处于“告警中” - AI开发平台ModelArts

训练前卡死 - AI开发平台ModelArts

部署在线服务出现报错No CUDA runtime is found - AI开发平台ModelArts

更新节点池 - AI开发平台ModelArts

服务部署失败，报错No Module named XXX - AI开发平台ModelArts

按标签名称更新单个标签 - AI开发平台ModelArts

从DLI导入数据到ModelArts数据集 - AI开发平台ModelArts

查询数据集的标注任务列表 - AI开发平台ModelArts

数据集版本不合格 - AI开发平台ModelArts

如何保证训练和调试时文件路径保持一致 - AI开发平台ModelArts

执行LoRA微调训练任务 - AI开发平台ModelArts

执行LoRA微调训练任务 - AI开发平台ModelArts

管理开发环境实例 - AI开发平台ModelArts

变更计费模式概述 - AI开发平台ModelArts

为什么在ModelArts数据标注平台标注数据提示标注保存失败？ - AI开发平台ModelArts

ModelArts环境挂载目录说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线