搜索_华为云

查看日志和性能 - AI开发平台ModelArts

查看日志和性能查看日志训练过程中，训练日志会在最后的Rank节点打印。图1 打印训练日志训练完成后，如果需要单独获取训练日志文件，可以在${SAVE_PATH}/logs路径下获取。日志存放路径为：/home/ma-user/ws/saved_dir_for_ma_output/llama2-70b/logs

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905）
开发Workflow命令参考 - AI开发平台ModelArts

配置Workflow的输入输出目录创建Workflow节点构建Workflow多分支运行场景编排Workflow 发布Workflow 在Workflow中更新已部署的服务 Workflow高阶能力父主题：使用Workflow实现低代码AI开发

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
附录：微调训练常见问题 - AI开发平台ModelArts

增加卡数重新训练，未解决找相关人员定位。问题2：访问容器目录时提示Permission denied 解决方法：由于在容器中没有相应目录的权限，会导致访问时提示Permission denied。可以在宿主机中对相关目录做权限放开，执行命令如下。 chmod 777 -R ${dir} 问题3：训练过程报错：ImportError:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908）
日志提示"Permission denied" - AI开发平台ModelArts

13]Permission denied: '/xxx/xxxx' 上传数据时文件所属与文件权限未修改，导致训练作业以work用户组访问时没有权限了。在代码目录中的.sh复制到容器之后，需要添加“x”可执行权限。 bash: /bin/ln: Permission denied 因安全问题，不支持用户开通使用In命令。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 权限问题
计费FAQ - AI开发平台ModelArts
计费FAQ - AI开发平台ModelArts

欠费后，ModelArts的资源是否会被删除？ ModelArts Standard数据管理相关计费FAQ ModelArts Standard自动学习所创建项目一直在扣费，如何停止计费？ ModelArts Standard训练作业和模型部署如何收费？

帮助中心 > AI开发平台ModelArts > 计费说明
训练的数据集预处理说明 - AI开发平台ModelArts

sh脚本，将执行的python命令复制下来，修改环境变量的值。在Notebook进入到 /home/ma-user/work/llm_train/AscendSpeed/ModelLink 路径中，再执行python命令。方法二：用户在Notebook中直接编辑scripts/llama2/1_preprocess_data

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
服务管理 - AI开发平台ModelArts
服务管理 - AI开发平台ModelArts

服务管理服务管理概述在开发环境中部署本地服务进行调试部署在线服务查询服务详情推理服务测试查询服务列表查询服务对象列表更新服务配置查询服务监控信息查询服务日志删除服务

 帮助中心 > AI开发平台ModelArts > SDK参考
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

页面。图2 配置中心根据图3，按步骤进行：判断是否安装 kubectl、下载kubectl配置文件、在机器中安装和配置kubectl。图3 kubectl访问集群配置在节点机器中，输入命令，查看Kubernetes集群信息。若显示如图图4的内容，则配置成功。 kubectl

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 准备工作
数据存储 - AI开发平台ModelArts
数据存储 - AI开发平台ModelArts

如何对OBS的文件重命名？ Notebook停止或者重启后，“/cache”下的文件还存在么？如何避免重启？如何使用pandas库处理OBS桶中的数据？在Notebook中，如何访问其他账号的OBS桶？ JupyterLab默认工作路径是什么？父主题： Standard Notebook

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
Notebook自定义镜像故障基础排查 - AI开发平台ModelArts

-user权限为750，不能为其他权限；用户自定义镜像使用远程SSH功能，OpenSSH版本要兼容或高于8.0；用户制作的自定义镜像，在本地执行docker run启动，无法正常运行；用户自行安装了Jupyterlab服务导致冲突的，需要用户本地使用Jupyterlab命令

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障
查看日志和性能 - AI开发平台ModelArts

${pod_name} 训练过程中，训练日志会在最后的Rank节点打印。图1 打印训练日志训练完成后，如果需要单独获取训练日志文件，可以在${SAVE_PATH}/logs路径下获取。日志存放路径为：/home/ma-user/ws/saved_dir_for_ma_output/llama2-70b/logs

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.911）
通过Function Calling扩展大语言模型交互能力 - AI开发平台ModelArts

通过Function Calling扩展大语言模型交互能力 Function Calling介绍在Dify中配置支持Function Calling的模型使用通过Function Calling扩展大语言模型对外部环境的理解

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
托管数据集到AI Gallery - AI开发平台ModelArts

支持编辑资产介绍。每个资产介绍可分为基础设置和使用描述。基础设置部分包含了该资产所有重要的结构化元数据信息。选择填入的信息将会变成该模型资产的标签，并且自动同步在模型描述部分，保存到“README.md”文件里。模型描述部分是一个可在线编辑、预览的Markdown文件，里面包含该模型的简介、能力描述

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery数据集
附录：大模型推理常见问题 - AI开发平台ModelArts

附录：大模型推理常见问题问题1：在推理预测过程中遇到NPU out of memory 解决方法：调整推理服务启动时的显存利用率，将--gpu-memory-utilization的值调小。问题2：在推理预测过程中遇到ValueError:User-specified max_model_len

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.911）
镜像方案说明 - AI开发平台ModelArts

ECS中构建新镜像方案：在ECS中，通过运行Dockerfile文件会在基础镜像上创建新的镜像。新镜像命名可自定义。Dockerfile会下载Megatron-LM、MindSpeed、ModelLink源码，并将以上源码打包至镜像环境中。如果用户希望修改源码，则需要使用新镜像创建容器，在容器内

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.911） > 准备工作 > 准备镜像
镜像方案说明 - AI开发平台ModelArts

ECS中构建新镜像方案：在ECS中，通过运行Dockerfile文件会在基础镜像上创建新的镜像。新镜像命名可自定义。Dockerfile会下载Megatron-LM、MindSpeed、ModelLink源码，并将以上源码打包至镜像环境中。如果用户希望修改源码，则需要使用新镜像创建容器，在容器内

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.910） > 准备工作 > 准备镜像
代码运行故障 - AI开发平台ModelArts

代码运行故障 Notebook运行代码报错，在'/tmp'中到不到文件 Notebook无法执行代码，如何处理？运行训练代码，出现dead kernel，并导致实例崩溃如何解决训练过程中出现的cudaCheckError错误？如何处理使用opencv.imshow造成的内核崩溃？

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境
数据标注 - AI开发平台ModelArts
数据标注 - AI开发平台ModelArts

数据标注物体检测图片标注，一张图片是否可以添加多个标签？在物体检测作业中上传已标注图片后，为什么部分图片显示未标注？父主题： Standard自动学习

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习
CodeLab - AI开发平台ModelArts
CodeLab - AI开发平台ModelArts

clone的py文件变为ipynb文件 Notebook里面运行的实例，如果重启，数据集会丢失么？ Jupyter可以安装插件吗？是否支持在CodeLab中使用昇腾的卡进行训练？如何在CodeLab上安装依赖？父主题： Standard Notebook

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
训练过程读取数据 - AI开发平台ModelArts

训练过程读取数据在ModelArts上训练模型，输入输出数据如何配置？如何提升训练效率，同时减少与OBS的交互？大量数据文件，训练过程中读取数据效率低？使用Moxing时如何定义路径变量？父主题： Standard训练作业

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业

总条数： 1902

上一页
1
...
87
88
89
...
96
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查看日志和性能 - AI开发平台ModelArts

开发Workflow命令参考 - AI开发平台ModelArts

附录：微调训练常见问题 - AI开发平台ModelArts

日志提示"Permission denied" - AI开发平台ModelArts

计费FAQ - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

服务管理 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

数据存储 - AI开发平台ModelArts

Notebook自定义镜像故障基础排查 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

通过Function Calling扩展大语言模型交互能力 - AI开发平台ModelArts

托管数据集到AI Gallery - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

镜像方案说明 - AI开发平台ModelArts

镜像方案说明 - AI开发平台ModelArts

代码运行故障 - AI开发平台ModelArts

数据标注 - AI开发平台ModelArts

CodeLab - AI开发平台ModelArts

训练过程读取数据 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线