搜索_华为云

查看训练作业日志 - AI开发平台ModelArts

1*Snt9时，device id取值为0。 rank id为本次训练作业的全局NPU卡编号，取值为0~实例数*卡数-1，单个实例下，rank id与device id取值相同。样例： modelarts-job-95f661bd-1527-41b8-971c-eca55e513254-

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
日志提示"Permission denied" - AI开发平台ModelArts

[Errno 13]Permission denied: '/xxx/xxxx' 上传数据时文件所属与文件权限未修改，导致训练作业以work用户组访问时没有权限了。在代码目录中的.sh复制到容器之后，需要添加“x”可执行权限。 bash: /bin/ln: Permission denied

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 权限问题
MoXing常用操作的样例代码 - AI开发平台ModelArts

append时，如果被写入文件不存在，则会创建，如果已经存在，则直接追加。当被追加的源文件比较大时，例如“obs://bucket_name/obs_file.txt”文件大小超过5MB时，追加一个OBS文件的性能比较低。如果以写入模式或追加模式打开文件，当调用write方法时，待写入内容只

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 在Notebook中使用Moxing命令
git插件密码失效如何解决？ - AI开发平台ModelArts

clone私有仓库和git push文件时，需要在授权方式框中输入token（见下图）；具体获取token方式请参考查看GitHub中Personal Access Token信息。父主题： JupyterLab插件故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > JupyterLab插件故障
NPU日志收集上传 - AI开发平台ModelArts

件，文件名一般为：credentials.csv。如下图所示，文件包含了租户名（User Name），AK（Access Key Id），SK（Secret Access Key）。图1 credential.csv文件内容 AK/SK生成步骤：登录管理控制台。单击右上角

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
ModelArts入门实践 - AI开发平台ModelArts

Standard平台上进行训练。镜像中使用的AI引擎是Pytorch，训练使用的资源是CPU或GPU。面向熟悉代码编写和调测的AI工程师，同时熟悉docker容器知识从 0 制作自定义镜像并用于训练（MindSpore+Ascend）本案例介绍如何从0开始制作镜像，并使用该镜像在ModelArts

帮助中心 > AI开发平台ModelArts > 快速入门
查询数据处理任务的版本详情 - AI开发平台ModelArts

tgroup/tbody/row/entry/p/br {""}) (br]、Map<String,String>类型。对于数据预处理任务比较特殊的两个场景物体检测和图像分类，键“task_type”对应的值为“object_detection”或“image_classification”。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
MaaS大模型即服务平台功能介绍 - AI开发平台ModelArts

MaaS大模型即服务平台功能介绍对于普通企业来说，大模型开发不仅需要强大的算力，还需要学习训练、部署的相关参数配置和规格选择等专业知识。ModelArts Studio大模型即服务平台（后续简称为MaaS服务）作为一个面向客户的大模型服务化平台，提供简单易用的模型开发工具链，支

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍
查看ModelArts相关审计日志 - AI开发平台ModelArts

查看ModelArts相关审计日志在您开启了云审计服务后，系统会记录ModelArts的相关操作，且控制台保存最近7天的操作记录。本节介绍如何在云审计服务管理控制台查看最近7天的操作记录。操作步骤登录云审计服务管理控制台。在管理控制台左上角单击图标，选择区域。在左侧导航

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用CTS审计ModelArts服务
删除AI应用 - AI开发平台ModelArts

删除AI应用功能介绍删除AI应用，根据AI应用ID删除指定AI应用，cascade取值为true时除了删除AI应用ID指定的AI应用，还会删除其他与指定AI应用同名不同版本的AI应用；默认只删除当前AI应用ID所对应的AI应用。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
查询服务日志 - AI开发平台ModelArts

UTC'的毫秒数。 result String 更新结果，取值为：SUCCESS/FAIL/RUNNING。 config Config结构数组更新后的服务配置，当infer_type为real-time时，会返回此值。 success_num Number 操作成功的节点数，当infer_type为edge时，会返回此值。

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
查询训练作业镜像保存任务 - AI开发平台ModelArts

响应Body参数参数参数类型描述 name String 镜像名称，长度限制512个字符，支持小写字母、数字、中划线、下划线和点。 namespace String 镜像所属组织，可以在SWR控制台“组织管理”创建和查看。 tag String 镜像tag，长度限制64个字符，支

 帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
离线训练安装包准备说明 - AI开发平台ModelArts

注意：该文件夹从Megatron-LM中复制得到 |——... 步骤二：资源安装将资源上传至机器中，确保容器能够访问，并进入已创建的容器。 Python依赖包本地安装：进入pip文件所在的路径，并运行安装命令。如下列所示。 pip install numpy pip

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明参考
查询训练作业列表 - AI开发平台ModelArts

nfs_server_path String nfs服务端路径，如：“10.10.10.10:/example/path”。 local_path String 挂载到训练容器中的路径，如：“/example/path”。 read_only Boolean nfs挂载卷在容器中是否只读。表55 LogExportPath

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
查询镜像详情 - AI开发平台ModelArts

service_type String 镜像支持服务类型。枚举值如下： COMMON：通用镜像。 INFERENCE: 建议仅在推理部署场景使用。 TRAIN: 建议仅在训练任务场景使用。 DEV: 建议仅在开发调测场景使用。 UNKNOWN: 未明确设置的镜像支持的服务类型。 size Long 镜像大小（单位KB）。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
GPU裸金属服务器使用EulerOS内核误升级如何解决 - AI开发平台ModelArts

(SP9x86_64) boot_success=0 [root@Server-ddff ~]# 如上发现reboot后内核为4.18.0-147.5.1.6.h998.eulerosv2r9.x86_64，和当前内核版本h934不一致，则需要重新设置内核版本与当前版本一致。查看当前内核

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

准备镜像准备推理模型适用的容器镜像。准备Notebook 本案例在Notebook上部署推理服务进行调试，因此需要创建Notebook。部署推理服务在Notebook调试环境中部署推理服务介绍如何在Notebook中配置NPU环境，部署并启动推理服务，完成精度测试和性能测试。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
端到端运维ModelArts Standard推理服务方案 - AI开发平台ModelArts

整个运维过程会对服务请求失败和资源占用过高的场景进行监控，当超过阈值时发送告警通知。图2 监控告警流程图方案优势通过端到端的服务运维配置，可方便地查看业务运行高低峰情况，并能够实时感知在线服务的健康状态。约束限制端到端服务运维只支持在线服务，因为推理的批量服务和边缘服务无CES

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
离线训练安装包准备说明 - AI开发平台ModelArts

注意：该文件夹从Megatron-LM中复制得到 |——... 步骤二：资源安装将资源上传至机器中，确保容器能够访问，并进入已创建的容器。 Python依赖包本地安装：进入pip文件所在的路径，并运行安装命令。如下列所示。 pip install numpy pip

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明参考
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

# 训练启动脚本 |──performance.py # benchmark训练性能比较启动脚本 |──accuracy.py # benchmark训练精度启动脚本 |──model/Qwen2-7B/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作

总条数： 1170

上一页
1
...
35
36
37
...
59
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查看训练作业日志 - AI开发平台ModelArts

日志提示"Permission denied" - AI开发平台ModelArts

MoXing常用操作的样例代码 - AI开发平台ModelArts

git插件密码失效如何解决？ - AI开发平台ModelArts

NPU日志收集上传 - AI开发平台ModelArts

ModelArts入门实践 - AI开发平台ModelArts

查询数据处理任务的版本详情 - AI开发平台ModelArts

MaaS大模型即服务平台功能介绍 - AI开发平台ModelArts

查看ModelArts相关审计日志 - AI开发平台ModelArts

删除AI应用 - AI开发平台ModelArts

查询服务日志 - AI开发平台ModelArts

查询训练作业镜像保存任务 - AI开发平台ModelArts

离线训练安装包准备说明 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

查询镜像详情 - AI开发平台ModelArts

GPU裸金属服务器使用EulerOS内核误升级如何解决 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

端到端运维ModelArts Standard推理服务方案 - AI开发平台ModelArts

离线训练安装包准备说明 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线