搜索_华为云

训练日志失败分析 - AI开发平台ModelArts

重建作业：建议重建作业进行重试，大概率能修复问题。上一步不能解决问题时，可以尝试分析日志中提示的错误信息，定位并解决问题。也可以前往ModelArts论坛中查看是否有同类问题。Ascend训练场景可以前往昇腾论坛查看或提问。最后，如果以上均不能解决问题，可以提工单进行人工咨询。父主题：模型训练高可靠性

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
如何查看ModelArts的Notebook使用的cuda版本？ - AI开发平台ModelArts

如何查看ModelArts的Notebook使用的cuda版本？执行如下命令查看环境中的cuda版本。 ll /usr/local | grep cuda 举例：图1 查看当前环境的cuda版本如图1所示，当前环境中cuda版本为10.2 父主题： Standard Notebook

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
释放Lite Cluster资源 - AI开发平台ModelArts

Cluster”，在“弹性集群”页面，选择“Lite资源池”页签，查看资源池列表。在资源池列表中，单击操作列的“ > 退订”，跳转至“退订资源”页面。根据界面提示，确认需要退订的资源，并选择退订原因。确认退订信息无误后，勾选“资源退订后……”提示信息。单击“退订”，再次根据界面信息确认要退订的资源。再次单击

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
解析Manifest文件 - AI开发平台ModelArts

解析Manifest文件，支持本地和OBS。如果是OBS，需要Session信息。 manifest.parse_manifest(manifest_path, encoding='utf-8') 示例代码通过Manifest路径来解析获取Manifest的信息。 from modelarts.session

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > Manifest管理
更新训练作业描述 - AI开发平台ModelArts

训练作业的id，可通过创建训练作业生成的训练作业对象查询，如"job_instance.job_id"，或从查询训练作业列表的响应中获得。表2 update_job_configs请求参数说明参数是否必选参数类型描述 description 是 String 需要更改的训练作业的描述信息。无成功响应参数

 帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
使用前必读 - AI开发平台ModelArts

由账号在IAM中创建的用户，是云服务的使用人员，具有身份凭证（密码和访问密钥）。在我的凭证下，您可以查看账号ID和IAM用户ID。通常在调用API的鉴权过程中，您需要用到账号、用户和密码等信息。区域指云资源所在的物理位置，同一区域内可用区间内网互通，不同区域间内网不互通。通过在不同

 帮助中心 > AI开发平台ModelArts > API参考
查看Workflow工作流运行记录 - AI开发平台ModelArts

查看Workflow工作流运行记录运行记录是展示某条工作流所有运行状态数据的地方。在Workflow列表页，单击某条工作流的名称，进入该工作流的详情页面。在工作流的详情页，左侧区域即为该条工作流的所有运行记录。图1 查看运行记录您可以对当前工作流的所有运行记录，进行删除、编辑以及重新运行的操作。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 管理Workflow
使用AOM查看Lite Cluster监控指标 - AI开发平台ModelArts

单击“监控 > 指标浏览”，进入“指标浏览”“页面”，单击“添加指标查询”。图1 示例图片添加指标查询信息。图2 示例图片添加方式：选择“按指标维度添加”。指标名称：在右侧下拉框中选择“全量指标”，然后选择想要查询的指标，参考表1、表2 指标维度：填写过滤该指标的标签，请参考表4的Label名字栏。样例如下：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理 > 监控Lite Cluster资源
创建训练作业提示错误码ModelArts.2763 - AI开发平台ModelArts

创建训练作业时，提示ModelArts.2763 : 选择的支持实例无效，请检查请求中信息的合法性。原因分析用户选择的训练规格资源和算法不匹配。例如：算法支持的是GPU规格，创建训练作业时选择了ASCEND规格的资源类型。处理方法查看算法代码中设置的训练资源规格。检查创建训练作业时所选的资源规

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
LoRA微调训练 - AI开发平台ModelArts

导致训练失败。作业日志选择OBS中的路径，ModelArts的训练作业的日志信息则保存该路径下。最后，请参考查看日志和性能章节查看LoRA微调的日志和性能。了解更多ModelArts训练功能，可查看模型开发简介。 Step2 配置环境变量单击“增加环境变量”，在增加的环境变

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912）
管理Lite Cluster节点池 - AI开发平台ModelArts

当您需要更多节点池时，可单击“创建节点池”新增节点池，相关参数请参见Step6 购买Cluster资源。查看节点列表当您想查看某一节点池下的节点相关信息，可单击操作列的“节点列表”，可查询节点的名称、规格及可用区。更新节点池当您想更新节点池配置时，可单击操作列的“更新”，相关参数介绍请参见Step6

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
删除训练作业 - AI开发平台ModelArts

训练作业的id，可通过创建训练作业生成的训练作业对象查询，如"job_instance.job_id"，或从查询训练作业列表的响应中获得。无成功响应参数。表2 调用训练接口失败响应参数参数类型描述 error_msg String 调用失败时的错误信息，调用成功时无此字段。 error_code

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
使用Notebook代码样例 - AI开发平台ModelArts

共享的Notebook实例。搜索业务所需的Notebook实例，请参见查找和收藏资产。单击目标Notebook实例进入详情页面。在详情页面可以查看Notebook实例的“描述”、“限制”和“版本”等信息。在详情页面单击“Run in ModelArts”，跳转到Model

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 订阅使用
TensorFlow-1.8作业连接OBS时反复出现提示错误 - AI开发平台ModelArts

gfile”模块连接OBS，启动训练作业后会频繁打印如下日志信息： Connection has been released. Continuing. Found secret key 原因分析这是TensorFlow-1.8中会出现的情况，该日志是Info级别的，并不是错误信息，可以通过设置环境变量来屏蔽I

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
解析Pascal VOC文件 - AI开发平台ModelArts

解析xml文件支持本地和OBS，如果是OBS，需要Session信息。 PascalVoc.parse_xml(xml_file_path, session=None) 示例代码指定xml路径，通过调用parse_xml来解析获取xml文件的信息。 from modelarts.dataset

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > Manifest管理
查看模型评估结果 - AI开发平台ModelArts

查看模型评估结果训练作业运行结束后，ModelArts可为您的模型进行评估，并且给出调优诊断和建议。针对使用预置算法创建训练作业，无需任何配置，即可查看此评估结果（由于每个模型情况不同，系统将自动根据您的模型指标情况，给出一些调优建议，请仔细阅读界面中的建议和指导，对您的模型进行进一步的调优）。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
获取训练作业支持的AI预置框架 - AI开发平台ModelArts

是否为v1兼容模式。 run_user String 引擎默认启动用户uid。 image_info image_info object 引擎具体信息。表4 image_info 参数参数类型描述 cpu_image_url String cpu规格下对应镜像。 gpu_image_url

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
在ModelArts中数据标注完成后，标注结果存储在哪里？ - AI开发平台ModelArts

（包含数据及标注信息）。详细文件说明可参见数据集发布后，相关文件的目录结构说明。查看步骤在ModelArts管理控制台，进入“数据管理>数据集”。选择需查看数据集，单击名称左侧小三角，展开数据集详情。可获得“数据集输出位置”指定的OBS路径。获取标注信息前，需确保数据集已发布，至少有一个以上数据集版本。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据准备
发布技术文章（AI说） - AI开发平台ModelArts

在“AI说”页面，单击右侧“说一说”进入发布页面。在“AI说”发布页面，填写相关信息。图1 发布技术文章表1 填写说明区域填写说明 1 输入技术文章的标题。 2 选择技术文章所属分类。 3 输入摘要信息。 4 编辑技术文章的内容。右侧可以选择使用“富文本编辑器”或“markdo

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 参加活动
AIGC工具tailor使用指导 - AI开发平台ModelArts

h) 查询onnx模型的输入信息。 # 查询onnx模型的输入信息 t.get_model_input_info() 图1 查询onnx模型的输入输出信息查询onnx模型的输出信息。 # 查询模型的输出信息 t.get_model_output_info() 图2 查询onnx模型的输出信息

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理

总条数： 1534

上一页
1
...
18
19
20
...
77
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练日志失败分析 - AI开发平台ModelArts

如何查看ModelArts的Notebook使用的cuda版本？ - AI开发平台ModelArts

释放Lite Cluster资源 - AI开发平台ModelArts

解析Manifest文件 - AI开发平台ModelArts

更新训练作业描述 - AI开发平台ModelArts

使用前必读 - AI开发平台ModelArts

查看Workflow工作流运行记录 - AI开发平台ModelArts

使用AOM查看Lite Cluster监控指标 - AI开发平台ModelArts

创建训练作业提示错误码ModelArts.2763 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

管理Lite Cluster节点池 - AI开发平台ModelArts

删除训练作业 - AI开发平台ModelArts

使用Notebook代码样例 - AI开发平台ModelArts

TensorFlow-1.8作业连接OBS时反复出现提示错误 - AI开发平台ModelArts

解析Pascal VOC文件 - AI开发平台ModelArts

查看模型评估结果 - AI开发平台ModelArts

获取训练作业支持的AI预置框架 - AI开发平台ModelArts

在ModelArts中数据标注完成后，标注结果存储在哪里？ - AI开发平台ModelArts

发布技术文章（AI说） - AI开发平台ModelArts

AIGC工具tailor使用指导 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线