搜索_华为云

训练作业使用MoXing拷贝数据较慢，重复打印日志 - AI开发平台ModelArts

上，这样会导致下载数据很慢。在训练作业中，使用如下代码进行“.tar”包解压： import moxing as mox import os mox.file.copy_parallel("obs://donotdel-modelarts-test/AI/data/PyTorch-1

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
限制用户使用公共资源池 - AI开发平台ModelArts

在统一身份认证服务页面的左侧导航选择“用户组”，在用户组页面查找待授权的用户组名称，在右侧的操作列单击“授权”，勾选步骤2创建的两条自定义策略，单击“下一步”，选择授权范围方案，单击“确定”。此时，该用户组下的所有用户均有权限查看该用户组内成员创建的所有Notebook实例。如果没

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
使用moxing适配OBS路径，pandas读取文件报错 - AI开发平台ModelArts

码。 import pandas as pd import moxing as mox mox.file.shift('os', 'mox') # 将os的open操作替换未mox.file.File适配OBS路径的操作 param = {'encoding': 'utf-8'}

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
团队标注使用流程 - AI开发平台ModelArts

针对启用团队标注功能的数据标注任务，支持创建团队标注任务，将标注任务指派给不同的团队，由多人完成标注任务。同时，在成员进行数据标注过程中，支持发起验收、继续验收以及查看验收报告等功能。团队标注功能是以团队为单位进行管理，数据集启用团队标注功能时，必须指定一个团队。一个团队可以添加多个成员。一个账号最多可添加10个团队。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过团队标注方式标注数据
ModelArts Standard使用流程 - AI开发平台ModelArts

部署为在线服务部署为批量服务访问服务服务部署完成后，针对在线服务和边缘服务，您可以访问并使用服务，针对批量服务，您可以查看其预测结果。访问在线服务查看批量服务预测结果

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
SFT全参微调训练 - AI开发平台ModelArts

作业日志选择OBS中的路径，训练作业的日志信息则保存该路径下。最后，提交训练作业，训练完成后，请参考查看日志和性能章节查看SFT微调的日志和性能。了解更多ModelArts训练功能，可查看模型开发简介。父主题：主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908）
Lite Server资源配置流程 - AI开发平台ModelArts

解决方案。 3 配置Lite Server软件环境不同镜像中预安装的软件不同，您通过Lite Server算力资源和镜像版本配套关系章节查看已安装的软件。当Server服务器中预装的软件无法满足业务需求时，您可在Server服务器中配置所需要的软件环境。父主题： Lite Server资源配置

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
重装的包与镜像装CUDA版本不匹配 - AI开发平台ModelArts

新安装的包与镜像中带的CUDA版本不匹配。处理方法必现的问题，使用本地Pycharm远程连接Notebook调试安装。先远程登录到所选的镜像，使用“nvcc -V”查看目前镜像自带的CUDA版本。重装torch等，需要注意选择与上一步版本相匹配的版本。建议与总结在创建训练作业前，推荐您先使用Mode

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
Wav2Lip基于DevServer适配PyTorch NPU训练指导（6.3.902） - AI开发平台ModelArts

docker-engine-selinux.noarch docker-runc.aarch64 配置IP转发，用于容器内的网络访问。执行以下命令查看net.ipv4.ip_forward配置项的值，如果为1，可跳过此步骤。 sysctl -p | grep net.ipv4.ip_forward

帮助中心 > AI开发平台ModelArts > 最佳实践 > 数字人模型训练推理
为什么资源充足还是在排队？ - AI开发平台ModelArts

业或实例上，判断是否使用了专属资源池。如判断相关作业或实例可停止，则可以停止，释放出更多的资源。图1 总览单击进入专属资源池详情页面，查看作业列表。观察队头是否有其他作业在排队，如果已有作业在排队，则新建的作业需要继续等待。图2 作业排队列表如果通过排查计算，发现资源确

 帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
获取训练作业事件列表 - AI开发平台ModelArts

String 用户项目ID。获取方法请参见获取项目ID和名称。 training_job_id 是 String 训练作业ID。获取方法请参见查询训练作业列表。表2 Query参数参数是否必选参数类型描述 offset 否 Integer 数据条目偏移量。 limit 否 Integer

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
批量重启节点 - AI开发平台ModelArts

ls/{pool_name}/nodes/batch-reboot { "nodeNames" : [ "os-node-created-vrvrq", "os-node-created-4jczv" ] } 响应示例状态码： 200 OK。 { "job_id" :

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
日志提示"write line error" - AI开发平台ModelArts

处理方法如果在训练作业的工作目录下有core文件生成，可以在启动脚本最前面加上如下代码，来关闭core文件产生。 import os os.system("ulimit -c 0") 排查数据集大小，checkpoint保存文件大小，是否占满了磁盘空间。必现的问题，使用本

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
SFT全参微调训练任务 - AI开发平台ModelArts

<NODE_RANK=0> sh scripts/llama2/0_pl_sft_13b.sh localhost 1 0 训练完成后，请参考查看日志和性能章节查看SFT微调的日志和性能。父主题：主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905）
Standard资源池功能介绍 - AI开发平台ModelArts

在对专属资源池有一定了解后，如果您需要创建一个自己的专属资源池，您可参考创建Standard专属资源池来进行创建。专属资源池创建成功后，可在查看Standard专属资源池详情中查看专属资源池的详细信息。如果专属资源池的规格与您的业务不符，可通过扩缩容Standard专属资源池来调整专属资源池的规格。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理
训练中的权重转换说明 - AI开发平台ModelArts

/home/ma-user/ws/processed_for_ma_input/llama2-13b/converted_weights_TP${TP}PP${PP} 目录下查看转换后的权重文件。 Megatron转HuggingFace参数说明训练完成的权重文件默认不会自动转换为Hugging Face格式权重

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
报错“Bad owner or permissions on C:\Users\Administrator/.ssh/config”或“Connection permission denied (publickey)”如何解决？ - AI开发平台ModelArts

添加所有者：在同一窗口中，单击“添加”，在弹出的新窗口中，单击“主体”后面的“选择主体”，弹出“选择用户，计算机，服务账户或组”窗口，单击“高级”，输入用户名，单击“立即查找”按钮，显示用户搜索结果列表。选择您的用户账户，然后单击“确定”（大约四个窗口）以关闭所有窗口。图1 添加所有者完成所有操作后，再次关闭并打开VS

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
发布ModelArts数据集中的数据版本 - AI开发平台ModelArts

timestamp.jpg 查看数据集演进过程登录ModelArts管理控制台，在左侧菜单栏中选择“资产管理>数据集”，进入“数据集”管理页面。在数据集列表中，单击操作列的“更多 > 版本管理”，进入数据集“版本管理”页面。您可以查看数据集的基本信息，并在左侧查看版本演进信息及其发布时间。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
训练的权重转换说明 - AI开发平台ModelArts

processed_for_ma_input/llama2-13b/converted_weights_TP${TP}PP${PP}目录下查看转换后的权重文件。 Megatron转HuggingFace参数说明训练完成的权重文件默认不会自动转换为Hugging Face格式权重

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
LoRA微调训练 - AI开发平台ModelArts

<NODE_RANK=0> sh scripts/llama2/0_pl_lora_13b.sh localhost 1 0 训练完成后，请参考查看日志和性能章节查看LoRA微调训练的日志和性能。父主题：主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905）

总条数： 1281

上一页
1
...
56
57
58
...
65
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练作业使用MoXing拷贝数据较慢，重复打印日志 - AI开发平台ModelArts

限制用户使用公共资源池 - AI开发平台ModelArts

使用moxing适配OBS路径，pandas读取文件报错 - AI开发平台ModelArts

团队标注使用流程 - AI开发平台ModelArts

ModelArts Standard使用流程 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

Lite Server资源配置流程 - AI开发平台ModelArts

重装的包与镜像装CUDA版本不匹配 - AI开发平台ModelArts

Wav2Lip基于DevServer适配PyTorch NPU训练指导（6.3.902） - AI开发平台ModelArts

为什么资源充足还是在排队？ - AI开发平台ModelArts

获取训练作业事件列表 - AI开发平台ModelArts

批量重启节点 - AI开发平台ModelArts

日志提示"write line error" - AI开发平台ModelArts

SFT全参微调训练任务 - AI开发平台ModelArts

Standard资源池功能介绍 - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

报错“Bad owner or permissions on C:\Users\Administrator/.ssh/config”或“Connection permission denied (publickey)”如何解决？ - AI开发平台ModelArts

发布ModelArts数据集中的数据版本 - AI开发平台ModelArts

训练的权重转换说明 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线