搜索_华为云

附录：微调训练常见问题 - AI开发平台ModelArts

ed/elastic/agent/server/api.py文件参数： vim /home/ma-user/anaconda3/envs/PyTorch-2.2.0/lib/python3.10/site-packages/torch/distributed/elastic/agent/server/api

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908）
查看模型评估结果 - AI开发平台ModelArts

index_file = os.path.join(pb_dir, 'index') try: label_file = h5py.File(index_file, 'r') label_array = label_file['labels_list'][:]

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
开发用于自定义镜像训练的代码 - AI开发平台ModelArts

RANK_TABLE_FILE文件。当使用预置框架创建训练作业时，在训练过程中预置框架会自动解析Ascend HCCL RANK_TABLE_FILE文件，当使用自定义镜像创建训练作业时，就要适配训练代码使得训练过程中在代码里读取解析Ascend HCCL RANK_TABLE_FILE文件。 Ascend

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
更新算法 - AI开发平台ModelArts
更新算法 - AI开发平台ModelArts

参数类型描述 code_dir 否 String 算法的代码目录。如：“/usr/app/”。应与boot_file一同出现。 boot_file 否 String 算法的代码启动文件，需要在代码目录下。如：“/usr/app/boot.py”。应与code_dir一同出现。 command

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
在ModelArts Standard使用run.sh脚本实现OBS和训练容器间的数据传输 - AI开发平台ModelArts

可以用一个run脚本把整个流程包起来。run.sh脚本的内容可以参考如下示例： #!/bin/bash ##认证用的AK和SK硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。 ##本示例以AK和SK保存在环境变量中来实现身份验证为例，运行本示例前请先

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练任务
run.sh脚本测试ModelArts训练整体流程 - AI开发平台ModelArts

可以用一个run脚本把整个流程包起来。run.sh脚本的内容可以参考如下示例： #!/bin/bash ##认证用的AK和SK硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。 ##本示例以AK和SK保存在环境变量中来实现身份验证为例，运行本示例前请先

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ
日志提示“AttributeError: 'NoneType' object has no attribute 'dtype'” - AI开发平台ModelArts

import os os.system('pip install numpy==1.18.5') 如果依旧有报错情况，将以上代码修改为： import os os.system('pip install numpy==1.18.5') os.system('pip install

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
创建模型失败，如何定位和处理问题？ - AI开发平台ModelArts

模型文件目录下不能出现dockerfile文件，需要去掉模型文件目录下存在dockerfile文件。图2 构建日志：dockerfile文件目录有问题 pip软件包版本不匹配，需要修改为日志中打印的存在的版本。图3 pip版本不匹配构建日志中出现报错：“exec /usr/bin/sh:

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
在JupyterLab中使用MindInsight可视化作业 - AI开发平台ModelArts

MindSpore支持将数据信息保存到Summary日志文件中，并通过可视化界面MindInsight进行展示。前提条件使用MindSpore引擎编写训练脚本时，为了保证训练结果中输出Summary文件，您需要在脚本中添加收集Summary相关代码。将数据记录到Summary日志文件中的具体方式请参考收集Summary数据。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
发布本地AI应用到AI Gallery - AI开发平台ModelArts

当AI应用的状态变为“待启动”时，表示创建完成。启动AI应用上传AI应用的运行文件“app.py”。在AI应用详情页，选择“应用文件”页签，单击“添加文件”，进入上传文件页面。运行文件的开发要求请参见准备AI应用运行文件app.py。上传单个超过5GB的文件时，请使用Gallery CLI工具。CLI工具的获取和使用请参见Gallery

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用
创建算法 - AI开发平台ModelArts
创建算法 - AI开发平台ModelArts

参数类型描述 code_dir 否 String 算法的代码目录。如：“/usr/app/”。应与boot_file一同出现。 boot_file 否 String 算法的代码启动文件，需要在代码目录下。如：“/usr/app/boot.py”。应与code_dir一同出现。 command

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
导入模型 - AI开发平台ModelArts
导入模型 - AI开发平台ModelArts

必选，pytorch模型保存文件，保存为“state_dict”，存有权重变量等信息。 │ │ ├──config.json 必选：模型配置文件，文件名称固定为config.json，只允许放置一个 │ │ ├──customize_service.py 必选：模型推理代码，文件名称固定为customize_service

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
安装远端插件时不稳定，需尝试多次 - AI开发平台ModelArts

History页签后，下载该插件的离线安装包，如图所示。图1 Python插件离线安装包在本地VS Code环境中，将下载好的.vsix文件拖动到远端Notebook中。右键单击该文件，选择Install Extension VSIX。方法二：设置远端默认安装的插件按照VS Code中设置远端默

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code使用技巧
构建条件节点控制分支执行 - AI开发平台ModelArts

ondition、MetricInfo 表3 MetricInfo 属性描述是否必填数据类型 input_data metric文件的存储对象，当前仅支持JobStep节点的输出是 JobStep的输出 json_key 需要获取的metric信息对应的key值是 str

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 构建Workflow多分支运行场景
在Notebook中如何查看GPU使用情况 - AI开发平台ModelArts

py 如果当前进程使用GPU 如果当前没有进程使用GPU 方法二：打开文件“/resource_info/gpu_usage.json”，可以看到有哪些进程在使用GPU。如果当前没有进程使用GPU，该文件可能不存在或为空。父主题：更多功能咨询

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
查询网络资源 - AI开发平台ModelArts

Abnormal：网络连接不正常表12 sfsTurboStatus 参数参数类型描述 sfsId String SFS Turbo的ID。 name String SFS Turbo的名称。 status String 与SFS Turbo的连接状态信息。可选值如下： Active：SFS连通状态正常

 帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
模型调试 - AI开发平台ModelArts
模型调试 - AI开发平台ModelArts

ssion鉴权。将自定义的推理文件和模型配置文件保存在训练生成的模型文件目录下。如训练生成的模型保存在“/home/ma-user/work/tensorflow_mlp_mnist_local_mode/train/model/”中，则推理文件“customize_service

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
离线训练安装包准备说明 - AI开发平台ModelArts

可遵循以下步骤操作。步骤一：资源下载 Python依赖包下载：进入 scripts/install.sh 文件中，找到需要安装的pip文件，如下列所示。直接下载pip文件，注意：下载要求的版本。 pip install numpy==1.22.0 \ t

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明参考
训练作业使用MoXing复制数据较慢，重复打印日志 - AI开发平台ModelArts

重复打印日志，该日志表示正在读取远端存在的文件，当文件列表读取完成以后，开始下载数据。如果文件比较多，那么该过程会消耗较长时间。处理方法在创建训练作业时，数据可以保存到OBS上。不建议使用TensorFlow、MXNet、PyTorch的OBS接口直接从OBS上读取数据。如果文件较小，可以将OBS上的数据保存成“

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
发布ModelArts模型 - AI开发平台ModelArts

需购买商品的使用配额进行有偿使用。云商店仅支持企业级卖家发布商品，请在首次发布商品前入驻华为云商店成为企业级卖家。发布至AI大赛华为云人工智能大赛面向开发者组织了一些开发者大赛，您可以在ModelArts开发模型，并将参赛模型提交至对应的比赛项目。前提条件已在Model

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理ModelArts模型

总条数： 1770

上一页
1
...
70
71
72
...
89
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

附录：微调训练常见问题 - AI开发平台ModelArts

查看模型评估结果 - AI开发平台ModelArts

开发用于自定义镜像训练的代码 - AI开发平台ModelArts

更新算法 - AI开发平台ModelArts

在ModelArts Standard使用run.sh脚本实现OBS和训练容器间的数据传输 - AI开发平台ModelArts

run.sh脚本测试ModelArts训练整体流程 - AI开发平台ModelArts

日志提示“AttributeError: 'NoneType' object has no attribute 'dtype'” - AI开发平台ModelArts

创建模型失败，如何定位和处理问题？ - AI开发平台ModelArts

在JupyterLab中使用MindInsight可视化作业 - AI开发平台ModelArts

发布本地AI应用到AI Gallery - AI开发平台ModelArts

创建算法 - AI开发平台ModelArts

导入模型 - AI开发平台ModelArts

安装远端插件时不稳定，需尝试多次 - AI开发平台ModelArts

构建条件节点控制分支执行 - AI开发平台ModelArts

在Notebook中如何查看GPU使用情况 - AI开发平台ModelArts

查询网络资源 - AI开发平台ModelArts

模型调试 - AI开发平台ModelArts

离线训练安装包准备说明 - AI开发平台ModelArts

训练作业使用MoXing复制数据较慢，重复打印日志 - AI开发平台ModelArts

发布ModelArts模型 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线