搜索_华为云

约束与限制 - AI开发平台ModelArts

Gallery中订阅的算法不支持另存为新算法。训练作业卡死检测目前仅支持资源类型为GPU的训练作业。仅使用新版专属资源池训练时才支持设置训练作业优先级。公共资源池和旧版专属资源池均不支持设置训练作业优先级。仅支持PyTorch和MindSpore框架的分布式训练和调测，如果MindSpore要进行多

 帮助中心 > AI开发平台ModelArts > 产品介绍
常见问题 - AI开发平台ModelArts
常见问题 - AI开发平台ModelArts

在模型转换的过程，如果出现模型转换失败，可以参考以下步骤查看日志并定位原因：设置DEBUG日志。设置MindSpore日志环境变量。 # shell export GLOG_v=0 # 0-DEBUG、1-INFO、2-WARNING、3-ERROR 设置CANN日志环境变量。 # shell export

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
查询训练作业指定任务的日志（OBS链接） - AI开发平台ModelArts

表2 请求Header参数参数是否必选参数类型描述 Content-Type 否 String 消息体的类型。设置为text/plain，返回临时预览链接。设置为application/octet-stream，返回临时下载链接。响应参数状态码：200 表3 响应Body参数

 帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
在ModelArts Standard运行GPU训练作业的准备工作 - AI开发平台ModelArts

ModelArts支持设置子账号的细粒度权限、不同工作空间之间资源隔离。ModelArts工作空间帮您实现项目资源隔离、多项目分开结算等功能。如果您开通了企业项目管理服务的权限，可以在创建工作空间的时候绑定企业项目ID，并在企业项目下添加用户组，为不同的用户组设置细粒度权限供组里的用户使用。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
管理Lite Cluster节点 - AI开发平台ModelArts

选择下拉框中支持的操作系统。配置方式选择重置节点的配置方式。按节点比例：重置任务包含多个节点时，可以设置同时被重置节点的最高比例。按实例数量：重置任务包含多个节点时，可以设置同时被重置节点的最大个数。驱动版本可以在下拉框中指定重置节点的驱动版本。图1 重置节点单击“操

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
使用PyCharm Toolkit插件连接Notebook - AI开发平台ModelArts

查看运行日志也可以单击本地IDE右上角的Run/Debug Configuration按钮来设置运行参数。图11 设置运行参数（1）选择远程连接到云上开发环境实例对应的Python解释器。图12 设置运行参数（2）当需要调试代码时，可以直接打断点，然后使用debug方式运行程序。图13

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过PyCharm远程使用Notebook实例
查询DevServer实例详情 - AI开发平台ModelArts

String> 通过应用专属URL直接打开应用进入远程开发模式。 ssh_keys Array of strings SSH密钥对名称列表，允许设置多个密钥对实现同时对SSH实例的访问。表5 EndpointsRes 参数参数类型描述 allowed_access_ips Array

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
执行训练任务【新】 - AI开发平台ModelArts

长度，则推荐增加此值（≥ 2）。（此参数目前仅适用于Llama3系列模型长序列训练） lr 2.5e-5 学习率设置。 min-lr 2.5e-6 最小学习率设置。 seq-length 4096 要处理的最大序列长度。 convert_mg2hf_at_last 1 Mega

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
删除DevServer实例 - AI开发平台ModelArts

String> 通过应用专属URL直接打开应用进入远程开发模式。 ssh_keys Array of strings SSH密钥对名称列表，允许设置多个密钥对实现同时对SSH实例的访问。表5 EndpointsRes 参数参数类型描述 allowed_access_ips Array

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
停止DevServer实例 - AI开发平台ModelArts

String> 通过应用专属URL直接打开应用进入远程开发模式。 ssh_keys Array of strings SSH密钥对名称列表，允许设置多个密钥对实现同时对SSH实例的访问。表5 EndpointsRes 参数参数类型描述 allowed_access_ips Array

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
精度调优前准备工作 - AI开发平台ModelArts

在定位精度问题之前，首先需要排除训练脚本及参数配置等差异的干扰。目前大部分精度无法对齐的问题都是由于模型超参数、Python三方库版本、模型源码等与标杆环境（GPU/CPU）设置的不一致导致，为了在定位过程中少走弯路，需要在定位前先对训练环境及代码做有效排查。此外，问题定位主要基于GPU环境和NPU环境上运行的过程

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
使用ModelArts PyCharm插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

持在GPU或者Ascend上训练，那么可能会报错，需要使用Notebook进行云端调试。设置断点后单击“调试”，可实现代码逐步调试，查看中间变量值。图9 “调试”按钮图10 通过设置断点实现代码调试可单击“运行”按钮，通过日志观察是否能正常训练。图11 “运行”按钮图12

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
启动DevServer实例 - AI开发平台ModelArts

String> 通过应用专属URL直接打开应用进入远程开发模式。 ssh_keys Array of strings SSH密钥对名称列表，允许设置多个密钥对实现同时对SSH实例的访问。表6 EndpointsRes 参数参数类型描述 allowed_access_ips Array

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
模型的自定义镜像制作流程 - AI开发平台ModelArts

的“keep-alive”参数设置为200s。以gunicorn服务框架为例，gunicorn缺省情形下不支持keep-alive，需要同时安装gevent并配置启动参数“--keep-alive 200 -k gevent”。不同服务框架参数设置有区别，请以实际情况为准。（可

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
在Linux上安装配置Grafana - AI开发平台ModelArts

grafana-server 在本地PC访问Grafana配置。确保ECS绑定了弹性公网IP，且对应配置正确（入方向放开TCP协议的3000端口，出方向全部放通）。设置如下：单击ECS服务器名称进入详情页，单击“安全组”页签，单击“配置规则”。单击“入方向规则”，入方向放开TCP协议的3000端口，出方向默认全部放通。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控 > 使用Grafana查看AOM中的监控指标 > 安装配置Grafana
在ModelArts的Notebook中，如何使用昇腾多卡进行调试？ - AI开发平台ModelArts

昇腾多卡训练任务是多进程多卡模式，跑几卡需要起几个python进程。昇腾底层会读取环境变量：RANK_TABLE_FILE，开发环境已经设置，用户无需关注。比如跑八卡，可以如下片段代码： export RANK_SIZE=8 current_exec_path=$(pwd)

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
资源池创建失败的原因与解决方法？ - AI开发平台ModelArts

用户可根据实际业务场景和节点规模，自定义配置容器网段，配置方式如下： ModelArts Standard池，资源池创建阶段指定容器网段，根据实际需要设置更大的容器网段。图7 设置容器网段 ModelArts Lite池，选择/创建具有更大容器网段的CCE集群。CCE容器网段配置参见网络规划。账号冻结导致创建失败？

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
执行训练任务（推荐） - AI开发平台ModelArts

processed_data_dir /home/ma-user/ws/xxx 已处理好数据路径目录，如有处理完成数据可设置此参数权重文件、输出目录及其他重要参数设置,详解如下：参数示例值参数说明 model_name_or_path /home/ma-user/ws/llm

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练任务
如何解决训练过程中出现的cudaCheckError错误？ - AI开发平台ModelArts

device 原因分析因为编译的时候需要设置setup.py中编译的参数arch和code和电脑的显卡匹配。解决方法对于GP Vnt1的显卡，GPU算力为-gencode arch=compute_70,code=[sm_70,compute_70]，设置setup.py中的编译参数即可解决。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
调用MaaS部署的模型服务 - AI开发平台ModelArts

Int 控制要考虑的前几个Tokens的数量的整数。设置为“-1”表示考虑所有Tokens。适当降低该值可以减少采样时间。 top_p 否 1.0 Float 控制要考虑的前几个Tokens的累积概率的浮点数。取值范围：0~1 设置为“1”表示考虑所有Tokens。 temperature

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）

总条数： 829

上一页
1
...
4
5
6
...
42
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

约束与限制 - AI开发平台ModelArts

常见问题 - AI开发平台ModelArts

查询训练作业指定任务的日志（OBS链接） - AI开发平台ModelArts

在ModelArts Standard运行GPU训练作业的准备工作 - AI开发平台ModelArts

管理Lite Cluster节点 - AI开发平台ModelArts

使用PyCharm Toolkit插件连接Notebook - AI开发平台ModelArts

查询DevServer实例详情 - AI开发平台ModelArts

执行训练任务【新】 - AI开发平台ModelArts

删除DevServer实例 - AI开发平台ModelArts

停止DevServer实例 - AI开发平台ModelArts

精度调优前准备工作 - AI开发平台ModelArts

使用ModelArts PyCharm插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

启动DevServer实例 - AI开发平台ModelArts

模型的自定义镜像制作流程 - AI开发平台ModelArts

在Linux上安装配置Grafana - AI开发平台ModelArts

在ModelArts的Notebook中，如何使用昇腾多卡进行调试？ - AI开发平台ModelArts

资源池创建失败的原因与解决方法？ - AI开发平台ModelArts

执行训练任务（推荐） - AI开发平台ModelArts

如何解决训练过程中出现的cudaCheckError错误？ - AI开发平台ModelArts

调用MaaS部署的模型服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线