搜索_华为云

训练精度测试 - AI开发平台ModelArts

s.yaml文件中默认配置，权重使用表1 模型权重中指定的Huggingface地址，数据指定data.tgz里面提供的gsm8k数据。查看精度结果任务完成之后会在test-benchmark目录下生成excel表格：精度结果 LLaMAFactory_train_accu

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练benchmark工具
训练精度测试 - AI开发平台ModelArts

s.yaml文件中默认配置，权重使用表1 模型权重中指定的Huggingface地址，数据指定data.tgz里面提供的gsm8k数据。查看精度结果任务完成之后会在test-benchmark目录下生成excel表格：精度结果 LLaMAFactory_train_accu

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练benchmark工具
获取动态挂载OBS实例信息列表 - AI开发平台ModelArts

orage 表1 路径参数参数是否必选参数类型描述 instance_id 是 String Notebook实例ID，可通过调用查询Notebook实例列表接口获取。 project_id 是 String 用户项目ID，获取方法请参见获取项目ID和名称。请求参数无

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
用户使用torch报错Unexpected error from cudaGetDeviceCount - AI开发平台ModelArts

如果环境中装了多版本的cuda，可以排查LD_LIBRARY_PATH中的cuda优先级，需要手动调整下。举例：如果cuda只兼容cuda-9.1，查询到LD_LIBRARY_PATH=/usr/local/cuda-11.8/lib64:/usr/local/cuda-9.1/lib64

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障
训练作业容错检查 - AI开发平台ModelArts

”关键字查看。当容错检查正常通过时，可以减少运行故障上报问题。容错检查失败时，会打印检查失败的日志。您可以通过在日志中搜索“item”关键字查看失败信息。如果作业重启次数没有达到设定的次数，则会自动做重新下发作业。您可以通过搜索“error,exiting”关键字查找作业重启失败结束的日志。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务介绍如何在Notebook中配置NPU环境，部署并启动推理服务，完成精度测试和性能测试。如果需要部署量化模型，需在Notebook中进行模型权重转换后再部署推理服务。在推理生产环境中部署推理服务介绍如何在创建AI应用，部署并启动推理服务，在线预测在线服务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
使用VS Code创建并调试训练作业 - AI开发平台ModelArts

elArts-HuaweiCloud，用户通过简易的操作，实现在本地IDE中进行训练配置、资源监控、作业管理、代码管理等动作。本章节介绍如何使用VS Code插件创建训练作业并调试。使用VS Code插件创建训练作业并调试功能目前是白名单，需要提交工单申请开通。准备工作创

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 创建调试训练作业
在ModelArts Standard上运行GPU单机多卡训练作业 - AI开发平台ModelArts

如果在linux服务器上运行就有问题，那么先调通以后再做容器镜像。确认打入镜像的文件是否在正确的位置、是否有正确的权限。训练场景主要查看自研的依赖包是否正常，查看pip list是否包含所需的包，查看容器直接调用的python是否是自己所需要的那个（如果容器镜像装了多个python，需要设置python路径的环境变量）。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
MoXing常用操作的样例代码 - AI开发平台ModelArts

列举一个OBS目录，只返回顶层结果（相对路径），不做递归列举。例如列举“obs://bucket_name/object_dir”，返回该目录下所有的文件和文件夹，不会递归查询。假设“obs://bucket_name/object_dir”中有如下结构 1 2 3 4 5 bucket_name |-

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 在Notebook中使用Moxing命令
训练物体检测模型 - AI开发平台ModelArts

在“物体检测”节点中，待训练状态由“运行中”变为“运行成功”，即完成模型的自动训练。图2 运行成功训练完成后，您可以单击物体检测节点上方的按钮，查看相关指标信息，如“准确率”、“评估结果”等。评估结果参数说明请参见表1。图3 模型评估报告表1 评估结果参数说明参数说明 recall：召回率

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现物体检测
ModelArts中常用概念 - AI开发平台ModelArts

h、MindSpore等)下均可以使用。 MoXing Framework模块提供了OBS中常见的数据文件操作，如读写、列举、创建文件夹、查询、移动、复制、删除等。在ModelArts Notebook中使用MoXing接口时，可直接调用接口，无需下载或安装SDK，使用限制比ModelArts

帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
动态挂载OBS - AI开发平台ModelArts

orage 表1 路径参数参数是否必选参数类型描述 instance_id 是 String Notebook实例ID，可通过调用查询Notebook实例列表接口获取。 project_id 是 String 用户项目ID，获取方法请参见获取项目ID和名称。请求参数表2

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
预训练任务 - AI开发平台ModelArts

/llm_train/saved_dir_for_output/llama2-13b/saved_models/。最后，请参考查看日志和性能章节查看预训练的日志和性能。步骤五删除config.yaml创建出的所有工作负载Pod 若要删除config.yaml创建出的所有工作负载Pod，需要先找到config

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909）
给子账号配置部署上线基本使用权限 - AI开发平台ModelArts

管理模型所需权限业务场景依赖的服务依赖策略项支持的功能配置建议管理模型 ModelArts modelarts:model:* 创建、删除、查看、导入AI模型。建议配置。仅在严格授权模式开启后，需要显式配置左侧权限。 SWR SWR Admin SWR Admin为SWR最大权限，用于：

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
预训练任务 - AI开发平台ModelArts

/llm_train/saved_dir_for_output/llama2-13b/saved_models/。最后，请参考查看日志和性能章节查看预训练的日志和性能。步骤五删除config.yaml创建出的所有工作负载Pod 若要删除config.yaml创建出的所有工作负载Pod，需要先找到config

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910）
预训练任务 - AI开发平台ModelArts

/llm_train/saved_dir_for_output/llama2-13b/saved_models/。最后，请参考查看日志和性能章节查看预训练的日志和性能。步骤五删除config.yaml创建出的所有工作负载Pod 若要删除config.yaml创建出的所有工作负载Pod，需要先找到config

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911）
在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

属资源池不与其他用户共享资源，更加高效。针对企业多用户场景，推荐使用专属资源池开展AI模型训练。本文提供了端到端案例指导，帮助您快速了解如何在ModelArts Standard上选择合适的训练方案并进行模型训练。针对不同的数据量和算法情况，推荐以下训练方案：单机单卡：小数

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
ECS获取和上传基础镜像 - AI开发平台ModelArts

#检查docker是否安装如尚未安装，运行以下命令安装docker。 yum install -y docker 配置IP转发，用于容器内的网络访问。执行以下命令查看net.ipv4.ip_forward配置项的值，如果为1，可跳过此步骤。 sysctl -p | grep net.ipv4.ip_forward

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作 > 准备镜像
训练声音分类模型 - AI开发平台ModelArts

作。在“声音分类”节点中，待训练状态由“运行中”变为“运行成功”，即完成模型的自动训练。训练完成后，您可以单击声音分类节点上方的按钮，查看相关指标信息，如“准确率”、“评估结果”等。表1 评估结果参数说明参数说明 recall：召回率被用户标注为某个分类的所有样本中，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现声音分类
精度校验 - AI开发平台ModelArts
精度校验 - AI开发平台ModelArts

ineDistanceThreshold =0.99表示余弦相似度至少为99%，--inputShapes可将模型放入到netron官网中查看。图1 benchmark对接结果输出示例图为了简化用户使用，ModelArts提供了Tailor工具便于用户进行Benchmark精

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导

总条数： 1529

上一页
1
...
64
65
66
...
77
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练精度测试 - AI开发平台ModelArts

训练精度测试 - AI开发平台ModelArts

获取动态挂载OBS实例信息列表 - AI开发平台ModelArts

用户使用torch报错Unexpected error from cudaGetDeviceCount - AI开发平台ModelArts

训练作业容错检查 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

使用VS Code创建并调试训练作业 - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机多卡训练作业 - AI开发平台ModelArts

MoXing常用操作的样例代码 - AI开发平台ModelArts

训练物体检测模型 - AI开发平台ModelArts

ModelArts中常用概念 - AI开发平台ModelArts

动态挂载OBS - AI开发平台ModelArts

预训练任务 - AI开发平台ModelArts

给子账号配置部署上线基本使用权限 - AI开发平台ModelArts

预训练任务 - AI开发平台ModelArts

预训练任务 - AI开发平台ModelArts

在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

ECS获取和上传基础镜像 - AI开发平台ModelArts

训练声音分类模型 - AI开发平台ModelArts

精度校验 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线