搜索_华为云

主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909）场景介绍准备工作预训练任务 SFT全参微调训练任务 LoRA微调训练查看日志和性能训练脚本说明常见错误原因和解决方法父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909）场景介绍准备工作预训练 SFT全参微调训练 LoRA微调训练查看日志和性能训练脚本说明常见错误原因和解决方法父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
硬盘限制故障 - AI开发平台ModelArts

硬盘限制故障下载或读取文件报错，提示超时、无剩余空间复制数据至容器中空间不足 Tensorflow多节点作业下载数据到/cache显示No space left 日志文件的大小达到限制日志提示"write line error" 日志提示“No space left on device”

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
预置算法运行故障 - AI开发平台ModelArts

预置算法运行故障日志提示“label_map.pbtxt cannot be found” 日志提示“root: XXX valid number is 0” 日志提示“ValueError: label_map not match” 日志提示“Please set the train_url

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
服务预测 - AI开发平台ModelArts
服务预测 - AI开发平台ModelArts

服务预测服务预测失败服务预测失败，报错APIG.XXXX 在线服务预测报错ModelArts.4206 在线服务预测报错ModelArts.4302 在线服务预测报错ModelArts.4503 在线服务预测报错MR.0105 Method Not Allowed 请求超时返回Timeout

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署
Lite Cluster - AI开发平台ModelArts
Lite Cluster - AI开发平台ModelArts

Lite Cluster 资源池创建失败的原因与解决方法？ Cluster资源池节点故障如何定位特权池信息数据显示均为0%如何解决？重置节点后无法正常使用？

帮助中心 > AI开发平台ModelArts > 故障排除
Ascend相关问题 - AI开发平台ModelArts

Ascend相关问题 Cann软件与Ascend驱动版本不匹配训练作业的日志出现detect failed（昇腾预检失败）父主题：训练作业

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
业务代码问题 - AI开发平台ModelArts

业务代码问题日志提示“pandas.errors.ParserError: Error tokenizing data. C error: Expected .* fields” 日志提示“max_pool2d_with_indices_out_cuda_frame failed

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
环境配置故障 - AI开发平台ModelArts

ModuleNotFoundError: No module named 'numba' JupyterLab中文件保存失败，如何解决？用户结束kernelgateway进程后报错Server Connection Error，如何恢复？父主题：开发环境

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境
如何保证训练和调试时文件路径保持一致 - AI开发平台ModelArts

如何保证训练和调试时文件路径保持一致云上挂载路径 Notebook中挂载SFS后，SFS默认在“/home/ma-user/work”路径下。在创建训练作业时，设置SFS Turbo的“云上挂载路径”为“/home/ma-user/work”，使得训练环境下SFS也在“/home/ma-user/work”路径下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ
新建Workflow工作流 - AI开发平台ModelArts

WorkflowStorage objects Workflow包含的统一存储定义。 labels 否 Array of strings 为Workflow工作流设置的标签。 assets 否 Array of WorkflowAsset objects 工作流绑定的资产。 sub_graphs 否 Array

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
审核并验收团队标注任务结果 - AI开发平台ModelArts

业名称进入“标注作业详情页”，单击右上角“团队标注>验收”，发起验收。图5 发起验收在弹出的对话框中，设置“抽样策略”，可设置为“按百分比”，也可以设置为“按数量”。设置好参数值后，单击“确定”启动验收。 “按百分比”：按待验收图片总数的一定比例进行抽样验收。 “按数量”：按一定数量进行抽样验收。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过团队标注方式标注数据
删除授权 - AI开发平台ModelArts
删除授权 - AI开发平台ModelArts

String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 user_id 否 String 用户ID，当user_id为all时，表示删除所有IAM子用户的授权。请求参数无响应参数无请求示例删除指定用户的授权 DELETE

帮助中心 > AI开发平台ModelArts > API参考 > 授权管理
发布免费模型 - AI开发平台ModelArts

限期使用。如果打开时长限制，除了设置资产免费使用的时长，还可以设置到期后是否续订。如果是更新已发布资产的版本。 “发布方式”选择“添加资产版本”。在“资产标题”下拉框中选择已有资产名称。支持搜索资产名称。设置“ModelArts区域”。设置可以使用该资产的ModelArts区域，以控制台实际可选值为准。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 发布分享
在MaaS体验模型服务 - AI开发平台ModelArts

在模型列表，选择要体验的模型服务，单击操作列“更多 > 体验”，进入体验页面。在参数设置页面，拖动或直接输入数值配置推理参数。单击“恢复默认”可以将参数值调回默认值。图2 设置推理参数表1 参数设置参数说明温度/Temperature 设置推理温度。数值较高，输出结果更加随机。数值较低，输出结果更加集中和确定。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
部署服务如何选择计算节点规格？ - AI开发平台ModelArts

部署服务如何选择计算节点规格？部署服务时，用户需要指定节点规格进行服务部署，界面目前显示的节点规格是ModelArts根据用户的AI应用和资源池的节点规格计算得到，用户可以选择ModelArts提供的规格，也可以使用自定义规格（公共资源池不支持）。计算节点规格主要是根据用户AI应用实际需要的资源进

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 功能咨询
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

Standard。资源规格需要使用专属资源池中的昇腾Snt9B资源，请参考创建资源池购买资源。推荐使用“西南-贵阳一”Region上的昇腾资源。专属资源池驱动检查登录ModelArts控制台，单击“专属资源池 > 弹性集群”，选择创建的专属资源池。图1 查看专属资源池在专属池详情页可查看驱动及固件版本。如下图显示Ascend驱动为7

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） > 准备工作
上传数据至OBS（首次使用时需要） - AI开发平台ModelArts

参考线下容器镜像构建及调试章节，构建容器镜像并调试，镜像构建及调试与单机单卡相同。上传镜像，参考单机单卡训练的上传镜像章节操作。操作步骤登录Imagenet数据集下载官网地址，下载Imagenet21k数据集：http://image-net.org/ 下载格式转换后的anno

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 多机多卡
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

Standard。资源规格需要使用专属资源池中的昇腾Snt9B资源，请参考创建资源池购买资源。推荐使用“西南-贵阳一”Region上的昇腾资源。专属资源池驱动检查登录ModelArts控制台，单击“专属资源池 > 弹性集群”，选择创建的专属资源池。图1 查看专属资源池在专属池详情页可查看驱动及固件版本。如下图显示Ascend驱动为7

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） > 准备工作
发布和管理AI Gallery项目 - AI开发平台ModelArts

性。编辑Notebook介绍在Notebook详情页，单击“项目介绍”。在基础设置中设置“许可证”、“语言”、“框架”、“任务类型”和“硬件资源”等信息。单击“确定”。编辑设置基本设置单击右侧的，可以更改Notebook名称和描述。编辑完成之后单击“确定”。关联资产

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）

总条数： 1365

上一页
1
...
46
47
48
...
69
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

硬盘限制故障 - AI开发平台ModelArts

预置算法运行故障 - AI开发平台ModelArts

服务预测 - AI开发平台ModelArts

Lite Cluster - AI开发平台ModelArts

Ascend相关问题 - AI开发平台ModelArts

业务代码问题 - AI开发平台ModelArts

环境配置故障 - AI开发平台ModelArts

如何保证训练和调试时文件路径保持一致 - AI开发平台ModelArts

新建Workflow工作流 - AI开发平台ModelArts

审核并验收团队标注任务结果 - AI开发平台ModelArts

删除授权 - AI开发平台ModelArts

发布免费模型 - AI开发平台ModelArts

在MaaS体验模型服务 - AI开发平台ModelArts

部署服务如何选择计算节点规格？ - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

上传数据至OBS（首次使用时需要） - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

发布和管理AI Gallery项目 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线