搜索_华为云

执行训练任务【新】 - AI开发平台ModelArts

作业日志选择OBS中的路径，ModelArts的训练作业的日志信息则保存该路径下。最后，请参考查看日志和性能章节查看LoRA微调的日志和性能。了解更多ModelArts训练功能，可查看模型开发简介。父主题：执行训练任务

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
管理AI Gallery镜像 - AI开发平台ModelArts

下架镜像 AI Gallery中已上架的资产支持下架操作。在AI Gallery首页，选择右上角“我的Gallery”。在“我的资产”下，查看已上架的资产。单击资产名称，进入资产详情页。在资产详情页，单击“下架”，在弹窗中单击“确定”。即可将资产下架。删除镜像当资产不使用时，支持删除，释放AI

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery镜像
发布模型到AI Gallery - AI开发平台ModelArts

支持1~90个字符，请勿在描述中输入涉政、迷信、违禁等相关敏感词，否则发布审核无法通过。可见范围 “所有用户可见”：表示公开资产，所有用户都可以查看该资产。 “指定用户可见”：输入账号名、账号ID或用户昵称搜索并选择用户，使其可见该资产。可用范围选择是否启用“申请用户可用”。勾选

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型
训练过程中无法找到so文件 - AI开发平台ModelArts

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64 执行如下命令，查看训练环境的cuda版本，确认当前cuda版本是否支持so文件。 os.system("cat /usr/local/cuda/version

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
ma-cli auto-completion自动补全命令 - AI开发平台ModelArts

ma-cli)" 此外，可以通过“ma-cli auto-completion Fish”或“ma-cli auto-completion Fish”命令查看“Zsh”、“Fish”中的自动补全命令。命令概览 $ ma-cli auto-completion -h Usage: ma-cli auto-completion

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
在MaaS体验模型服务 - AI开发平台ModelArts

1~1 默认值：1 top_k 选择在模型的输出结果中选择概率最高的前K个结果。取值范围：1~1000 默认值：20 在对话框中输入问题，查看返回结果，在线体验模型服务。图2 体验模型服务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
动态卸载OBS - AI开发平台ModelArts

e_id} 表1 路径参数参数是否必选参数类型描述 instance_id 是 String Notebook实例ID，可通过调用查询Notebook实例列表接口获取。 project_id 是 String 用户项目ID，获取方法请参见获取项目ID和名称。 storage_id

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
状态码 - AI开发平台ModelArts
状态码 - AI开发平台ModelArts

永久移动，请求的资源已被永久的移动到新的URI，返回信息会包括新的URI。 302 Found 资源被临时移动。 303 See Other 查看其它地址。使用GET和POST请求查看。 304 Not Modified 所请求的资源未修改，服务器返回此状态码时，不会返回任何资源。 305 Use Proxy

帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
已有镜像迁移至ModelArts用于训练模型 - AI开发平台ModelArts

100”用户组，可能会报错“groupadd: GID '100' already exists”。可通过命令“cat /etc/group | grep 100”查询是否已存在gid = 100用户组。如果已存在“gid = 100”用户组，则该步骤跳过，下文Dockerfile中删除“RUN groupadd

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
Notebook中快速使用MoXing - AI开发平台ModelArts

执行结果如图3所示。注意，每输入一行代码，单击下“Run”运行。您也可以进入OBS管理控制台，检查“modelarts-test08/moxing”目录，查看“test01”文件夹是否已创建成功。更多MoXing的常用操作请参见MoXing常用操作的样例代码。图3 运行示例复制数据到OBS

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 在Notebook中使用Moxing命令
设置无条件自动重启 - AI开发平台ModelArts

为了避免丢失训练进度、浪费算力，开启此功能前请确认代码已适配断点续训，操作指导请参见设置断点续训练。当训练过程中触发了自动重启，则系统会记录重启信息，在训练作业详情页可以查看故障恢复详情，具体请参见训练作业重调度。开启无条件自动重启开启无条件自动重启有2种方式：控制台设置或API接口设置。控制台设置在创

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
ModelArts中的作业为什么一直处于等待中？ - AI开发平台ModelArts

进入到相关作业或实例上，判断是否使用了专属资源池。如判断相关作业或实例可停止，则可以停止，释放出更多的资源。单击进入专属资源池详情页面，查看作业列表。观察队头是否有其他作业在排队，如果已有作业在排队，则新建的作业需要继续等待。如果通过排查计算，发现资源确实足够，则考虑可能由于资源碎片化导致的。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard专属资源池
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

作业日志选择OBS中的路径，训练作业的日志信息则保存该路径下。最后，提交训练作业，训练完成后，请参考查看日志和性能章节查看SFT微调的日志和性能。了解更多ModelArts训练功能，可查看模型开发简介。父主题：主流开源大模型基于Standard+OBS适配ModelLink PyTorch

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911）
SFT全参微调训练 - AI开发平台ModelArts

作业日志选择OBS中的路径，训练作业的日志信息则保存该路径下。最后，提交训练作业，训练完成后，请参考查看日志和性能章节查看SFT微调的日志和性能。了解更多ModelArts训练功能，可查看模型开发简介。父主题：主流开源大模型基于Standard+OBS适配ModelLink PyTorch

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911）
发布数据集到AI Gallery - AI开发平台ModelArts

支持1~90个字符，请勿在描述中输入涉政、迷信、违禁等相关敏感词，否则发布审核无法通过。可见范围 “所有用户可见”：表示公开资产，所有用户都可以查看该资产。 “指定用户可见”：输入账号名、账号ID或用户昵称搜索并选择用户，使其可见该资产。可用范围选择是否启用“申请用户可用”。勾选

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery数据集
训练精度测试 - AI开发平台ModelArts

s.yaml文件中默认配置，权重使用表1 模型权重中指定的Huggingface地址，数据指定data.tgz里面提供的gsm8k数据。查看精度结果任务完成之后会在test-benchmark目录下生成excel表格：精度结果 LLaMAFactory_train_accu

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练benchmark工具
训练精度测试 - AI开发平台ModelArts

s.yaml文件中默认配置，权重使用表1 模型权重中指定的Huggingface地址，数据指定data.tgz里面提供的gsm8k数据。查看精度结果任务完成之后会在test-benchmark目录下生成excel表格：精度结果 LLaMAFactory_train_accu

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练benchmark工具
用户使用torch报错Unexpected error from cudaGetDeviceCount - AI开发平台ModelArts

如果环境中装了多版本的cuda，可以排查LD_LIBRARY_PATH中的cuda优先级，需要手动调整下。举例：如果cuda只兼容cuda-9.1，查询到LD_LIBRARY_PATH=/usr/local/cuda-11.8/lib64:/usr/local/cuda-9.1/lib64

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障
获取动态挂载OBS实例信息列表 - AI开发平台ModelArts

orage 表1 路径参数参数是否必选参数类型描述 instance_id 是 String Notebook实例ID，可通过调用查询Notebook实例列表接口获取。 project_id 是 String 用户项目ID，获取方法请参见获取项目ID和名称。请求参数无

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
重试/停止/运行Workflow节点 - AI开发平台ModelArts

面，单击“重试”。在重试之前您也可以前往权限管理页面修改配置，节点重试启动后新修改的配置信息可以在当前执行中立即生效。停止单击指定节点查看详情，可以对运行中的节点进行停止操作。继续运行对于单个节点中设置了需要运行中配置的参数时，节点运行会处于“等待操作”状态，用户完成相关

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 管理Workflow

总条数： 1444

上一页
1
...
64
65
66
...
73
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

执行训练任务【新】 - AI开发平台ModelArts

管理AI Gallery镜像 - AI开发平台ModelArts

发布模型到AI Gallery - AI开发平台ModelArts

训练过程中无法找到so文件 - AI开发平台ModelArts

ma-cli auto-completion自动补全命令 - AI开发平台ModelArts

在MaaS体验模型服务 - AI开发平台ModelArts

动态卸载OBS - AI开发平台ModelArts

状态码 - AI开发平台ModelArts

已有镜像迁移至ModelArts用于训练模型 - AI开发平台ModelArts

Notebook中快速使用MoXing - AI开发平台ModelArts

设置无条件自动重启 - AI开发平台ModelArts

ModelArts中的作业为什么一直处于等待中？ - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

发布数据集到AI Gallery - AI开发平台ModelArts

训练精度测试 - AI开发平台ModelArts

训练精度测试 - AI开发平台ModelArts

用户使用torch报错Unexpected error from cudaGetDeviceCount - AI开发平台ModelArts

获取动态挂载OBS实例信息列表 - AI开发平台ModelArts

重试/停止/运行Workflow节点 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线