搜索_华为云

训练过程中无法找到so文件 - AI开发平台ModelArts

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64 执行如下命令，查看训练环境的cuda版本，确认当前cuda版本是否支持so文件。 os.system("cat /usr/local/cuda/version

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
在MaaS体验模型服务 - AI开发平台ModelArts

1~1 默认值：1 top_k 选择在模型的输出结果中选择概率最高的前K个结果。取值范围：1~1000 默认值：20 在对话框中输入问题，查看返回结果，在线体验模型服务。图2 体验模型服务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
动态卸载OBS - AI开发平台ModelArts

e_id} 表1 路径参数参数是否必选参数类型描述 instance_id 是 String Notebook实例ID，可通过调用查询Notebook实例列表接口获取。 project_id 是 String 用户项目ID，获取方法请参见获取项目ID和名称。 storage_id

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
Yaml配置文件参数配置说明 - AI开发平台ModelArts

gpu": "auto", "gradient_accumulation_steps": "auto", "gradient_clipping": "auto", "zero_allow_untested_optimizer": true, "fp16": {

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练脚本说明
已有镜像迁移至ModelArts用于训练模型 - AI开发平台ModelArts

100”用户组，可能会报错“groupadd: GID '100' already exists”。可通过命令“cat /etc/group | grep 100”查询是否已存在gid = 100用户组。如果已存在“gid = 100”用户组，则该步骤跳过，下文Dockerfile中删除“RUN groupadd

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
重试/停止/运行Workflow节点 - AI开发平台ModelArts

面，单击“重试”。在重试之前您也可以前往权限管理页面修改配置，节点重试启动后新修改的配置信息可以在当前执行中立即生效。停止单击指定节点查看详情，可以对运行中的节点进行停止操作。继续运行对于单个节点中设置了需要运行中配置的参数时，节点运行会处于“等待操作”状态，用户完成相关

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 管理Workflow
Notebook时长续约 - AI开发平台ModelArts

oks/{id}/lease 表1 路径参数参数是否必选参数类型描述 id 是 String Notebook实例ID，可通过调用查询Notebook实例列表接口获取。 project_id 是 String 用户项目ID，获取方法请参见获取项目ID和名称。表2 Query参数

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
提交验收任务的样本评审意见 - AI开发平台ModelArts

否 String 评审意见，限制长度为[0,256]，且不能包含!<>=&"'字符。 sample_id 否 String 样本ID，可调用查询样本列表接口获取。 score 否 String 评审分数，当前可取A/B/C/D四个值，从高到低排列。 worker_id 否 String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
设置无条件自动重启 - AI开发平台ModelArts

为了避免丢失训练进度、浪费算力，开启此功能前请确认代码已适配断点续训，操作指导请参见设置断点续训练。当训练过程中触发了自动重启，则系统会记录重启信息，在训练作业详情页可以查看故障恢复详情，具体请参见训练作业重调度。开启无条件自动重启开启无条件自动重启有2种方式：控制台设置或API接口设置。控制台设置在创

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
ModelArts中的作业为什么一直处于等待中？ - AI开发平台ModelArts

进入到相关作业或实例上，判断是否使用了专属资源池。如判断相关作业或实例可停止，则可以停止，释放出更多的资源。单击进入专属资源池详情页面，查看作业列表。观察队头是否有其他作业在排队，如果已有作业在排队，则新建的作业需要继续等待。如果通过排查计算，发现资源确实足够，则考虑可能由于资源碎片化导致的。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard专属资源池
使用VS Code创建并调试训练作业 - AI开发平台ModelArts

elArts-HuaweiCloud，用户通过简易的操作，实现在本地IDE中进行训练配置、资源监控、作业管理、代码管理等动作。本章节介绍如何使用VS Code插件创建训练作业并调试。使用VS Code插件创建训练作业并调试功能目前是白名单，需要提交工单申请开通。准备工作创

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 创建调试训练作业
训练作业容错检查 - AI开发平台ModelArts

”关键字查看。当容错检查正常通过时，可以减少运行故障上报问题。容错检查失败时，会打印检查失败的日志。您可以通过在日志中搜索“item”关键字查看失败信息。如果作业重启次数没有达到设定的次数，则会自动做重新下发作业。您可以通过搜索“error,exiting”关键字查找作业重启失败结束的日志。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
发布数据集到AI Gallery - AI开发平台ModelArts

支持1~90个字符，请勿在描述中输入涉政、迷信、违禁等相关敏感词，否则发布审核无法通过。可见范围 “所有用户可见”：表示公开资产，所有用户都可以查看该资产。 “指定用户可见”：输入账号名、账号ID或用户昵称搜索并选择用户，使其可见该资产。可用范围选择是否启用“申请用户可用”。勾选

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery数据集
获取动态挂载OBS实例信息列表 - AI开发平台ModelArts

orage 表1 路径参数参数是否必选参数类型描述 instance_id 是 String Notebook实例ID，可通过调用查询Notebook实例列表接口获取。 project_id 是 String 用户项目ID，获取方法请参见获取项目ID和名称。请求参数无

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
用户使用torch报错Unexpected error from cudaGetDeviceCount - AI开发平台ModelArts

如果环境中装了多版本的cuda，可以排查LD_LIBRARY_PATH中的cuda优先级，需要手动调整下。举例：如果cuda只兼容cuda-9.1，查询到LD_LIBRARY_PATH=/usr/local/cuda-11.8/lib64:/usr/local/cuda-9.1/lib64

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障
训练物体检测模型 - AI开发平台ModelArts

在“物体检测”节点中，待训练状态由“运行中”变为“运行成功”，即完成模型的自动训练。图2 运行成功训练完成后，您可以单击物体检测节点上方的按钮，查看相关指标信息，如“准确率”、“评估结果”等。评估结果参数说明请参见表1。图3 模型评估报告表1 评估结果参数说明参数说明 recall：召回率

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现物体检测
动态挂载OBS - AI开发平台ModelArts

orage 表1 路径参数参数是否必选参数类型描述 instance_id 是 String Notebook实例ID，可通过调用查询Notebook实例列表接口获取。 project_id 是 String 用户项目ID，获取方法请参见获取项目ID和名称。请求参数表2

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
精度校验 - AI开发平台ModelArts
精度校验 - AI开发平台ModelArts

ineDistanceThreshold =0.99表示余弦相似度至少为99%，--inputShapes可将模型放入到netron官网中查看。图1 benchmark对接结果输出示例图为了简化用户使用，ModelArts提供了Tailor工具便于用户进行Benchmark精

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
训练声音分类模型 - AI开发平台ModelArts

作。在“声音分类”节点中，待训练状态由“运行中”变为“运行成功”，即完成模型的自动训练。训练完成后，您可以单击声音分类节点上方的按钮，查看相关指标信息，如“准确率”、“评估结果”等。表1 评估结果参数说明参数说明 recall：召回率被用户标注为某个分类的所有样本中，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现声音分类
删除API - AI开发平台ModelArts
删除API - AI开发平台ModelArts

API ID。表2 Query参数参数是否必选参数类型描述 workspace_id 否 String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。请求参数表3 请求Header参数参数是否必选

 帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理

总条数： 1883

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练过程中无法找到so文件 - AI开发平台ModelArts

在MaaS体验模型服务 - AI开发平台ModelArts

动态卸载OBS - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

已有镜像迁移至ModelArts用于训练模型 - AI开发平台ModelArts

重试/停止/运行Workflow节点 - AI开发平台ModelArts

Notebook时长续约 - AI开发平台ModelArts

提交验收任务的样本评审意见 - AI开发平台ModelArts

设置无条件自动重启 - AI开发平台ModelArts

ModelArts中的作业为什么一直处于等待中？ - AI开发平台ModelArts

使用VS Code创建并调试训练作业 - AI开发平台ModelArts

训练作业容错检查 - AI开发平台ModelArts

发布数据集到AI Gallery - AI开发平台ModelArts

获取动态挂载OBS实例信息列表 - AI开发平台ModelArts

用户使用torch报错Unexpected error from cudaGetDeviceCount - AI开发平台ModelArts

训练物体检测模型 - AI开发平台ModelArts

动态挂载OBS - AI开发平台ModelArts

精度校验 - AI开发平台ModelArts

训练声音分类模型 - AI开发平台ModelArts

删除API - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线