搜索_华为云

用户执行huaweicloud.com相关API超时 - AI开发平台ModelArts

i.com不通过公网代理，huaweicloud.com域名在no_proxy/NO_PROXY中包含，就访问不了。解决方式执行以下命令查看在no_proxy/NO_PROXY中是否包含huaweicloud.com域名。 env | grep -i no_proxy 如果包

 帮助中心 > AI开发平台ModelArts > 故障排除 > API/SDK
LoRA微调训练 - AI开发平台ModelArts

单击“增加环境变量”，在增加的环境变量填写框中，按照表1表格中的配置进行填写。表1 需要填写的环境变量环境变量示例值参数说明 MOUNT OBS 默认必须填写。表示代码根据OBS存储方式运行。 MODEL_NAME llama2-13b 输入选择训练的模型名称。 RUN_TYPE

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911）
查看授权列表 - AI开发平台ModelArts

查看授权列表功能介绍查看授权列表。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/authorizations 表1 路径参数

 帮助中心 > AI开发平台ModelArts > API参考 > 授权管理
Finetune训练 - AI开发平台ModelArts

本章节介绍SDXL&SD 1.5模型的Finetune训练过程。Finetune是指在已经训练好的模型基础上，使用新的数据集进行微调（fine-tuning）以优化模型性能。启动SD1.5 Finetune训练服务使用ma-user用户执行如下命令运行训练脚本。 sh diffusers_finetune_train

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
Notebook中无法打开“checkpoints”文件夹 - AI开发平台ModelArts

操作步骤：打开Terminal，用命令行进行操作。方法一：执行cd checkpoints命令打开checkpoints文件夹。方法二：新建一个文件夹，移动checkpoints文件夹的数据到新建的文件夹下。执行mkdir xxx命令，新建一个文件夹，例如“xxx”（不要用checkpoints关键字命名）

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 其他故障
用户使用ma-cli制作自定义镜像失败，报错文件不存在（not found） - AI开发平台ModelArts

not found 原因分析复制的文件需要放在Dockerfile同级文件夹或者子目录中，不能放在Dockerfile上层目录。图2 Dockerfile复制文件路径错误解决方案查看用户Dockerfile中的COPY命令中的文件的路径。将要复制的文件放到Dockerfile同

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障
创建模型成功后，部署服务报错，如何排查代码问题 - AI开发平台ModelArts

用户自定义镜像或者通过基础镜像导入的模型时，用户自己编写了很多自定义的业务逻辑，这些逻辑有问题将会导致服务部署或者预测失败，需要能够排查出哪里有问题。处理方法服务部署失败后，进入服务详情界面，查看服务部署日志，明确服务部署失败原因（用户代码输出需要使用标准输入输出函数，否则输出的内容不会呈现到前

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
查询专属资源池作业列表 - AI开发平台ModelArts

查询专属资源池作业列表功能介绍查询专属资源池作业列表。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/pools/{pool_name}/workloads

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
API概览 - AI开发平台ModelArts
API概览 - AI开发平台ModelArts

及对应的所有存储资源。通过运行的实例保存成容器镜像运行的实例可以保存成容器镜像，保存的镜像中，安装的依赖包（pip包）不丢失，VSCode远程开发场景下，在Server端安装的插件不丢失。查询支持的有效规格列表查询支持的有效规格列表。查询支持可切换规格列表查询Notebook实例可切换的规格列表。

帮助中心 > AI开发平台ModelArts > API参考
Notebook运行代码报错，在'/tmp'中到不到文件 - AI开发平台ModelArts

根据报错提示，需要排查是否将大量数据被保存在“/tmp”中。处理方法进入到“Terminal”界面。在“/tmp”目录下，执行命令du -sh *，查看该目录下的空间占用情况。 sh-4.3$cd /tmp sh-4.3$du -sh * 4.0K core-js-banners

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
请求超时返回Timeout - AI开发平台ModelArts

优先排查APIG（API网关）是否是通的，可以在本地使用curl命令排查，命令行：curl -kv {预测地址}。如返回Timeout则需排查本地防火墙，代理和网络配置。检查模型是否启动成功或者模型处理单个消息的时长。因APIG（API网关）的限制，模型单次预测的时间不能超过40S，超过后系统会默认返回Timeout错误。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
执行训练任务（历史版本） - AI开发平台ModelArts

odels/。最后，请参考查看日志和性能章节查看预训练的日志和性能。步骤五删除config.yaml创建出的所有工作负载Pod 若要删除config.yaml创建出的所有工作负载Pod，需要先找到config.yaml所在路径，并执行以下命令。 kubectl delete

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练任务
查看批量服务的事件 - AI开发平台ModelArts

查看批量服务的事件服务的（从用户可看见部署服务任务开始）整个生命周期中，每一个关键事件点在系统后台均有记录，用户可随时在对应服务的详情页面进行查看。方便用户更清楚的了解服务部署和运行过程，遇到任务异常时，更加准确的排查定位问题。可查看的事件点包括：表1 事件事件类型事件

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理批量推理作业
查看在线服务的事件 - AI开发平台ModelArts

查看在线服务的事件服务的（从用户可看见部署服务任务开始）整个生命周期中，每一个关键事件点在系统后台均有记录，用户可随时在对应服务的详情页面进行查看。方便用户更清楚的了解服务部署和运行过程，遇到任务异常时，更加准确的排查定位问题。可查看的事件点包括：表1 事件事件类型事件

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
单模型性能测试工具Mindspore lite benchmark - AI开发平台ModelArts

dir_models/text_encoder.mindir --device=Ascend 上述命令中：modelFile指定生成的mindir模型文件；device指定运行推理的设备。其他用法请参考benchmark文档。测试结果如下所示：图1 测试结果父主题：性能调优

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 性能调优
查看日志和性能 - AI开发平台ModelArts

查看日志和性能单击作业详情页面，则可查看训练过程中的详细信息。图1 查看训练作业在作业详情页的日志页签，查看最后一个节点的日志，其包含“elapsed time per iteration (ms)”数据，可换算为tokens/s/p的性能数据。吞吐量（tokens/s/p）：global

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法 > 工作负载Pod异常
obsutil安装和配置 - AI开发平台ModelArts

obsutil是用于访问、管理对象存储服务OBS的命令行工具，使用该工具可以对OBS进行常用的配置管理操作，如创建桶、上传文件/文件夹、下载文件/文件夹、删除文件/文件夹等。 obsutil安装和配置的具体操作指导请参见obsutils快速入门。操作命令中的AK/SK要换成用户实际获取的AK/SK，Endp

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
使用自定义镜像创建训练作业找不到启动文件 - AI开发平台ModelArts

提示找不到运行的主文件：no such file or directory。原因分析根据报错提示可以判断是运行命令的启动文件目录不正确导致运行失败。处理方法需要排查执行命令的启动文件目录是否正确，具体操作如下：在ModelArts管理控制台，使用训练的自定义镜像创建训

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
LoRA训练 - AI开发平台ModelArts
LoRA训练 - AI开发平台ModelArts

LoRA训练本章节介绍SDXL&SD 1.5模型的LoRA训练过程。LoRA训练是指在已经训练好的模型基础上，使用新的数据集进行LoRA微调以优化模型性能的过程。启动SD1.5 LoRA训练服务使用ma-user用户执行如下命令运行训练脚本。 sh diffusers_lora_train

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
查询训练作业列表 - AI开发平台ModelArts

响应参数状态码： 200 表4 响应Body参数参数参数类型描述 total Integer 查询到当前用户名下的所有作业总数。 count Integer 查询到当前用户名下的所有符合查询条件的作业总数。 limit Integer 查询作业的每页条目数。最小为1，最大为50。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理

总条数： 2382

上一页
1
...
10
11
12
...
120
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

用户执行huaweicloud.com相关API超时 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

查看授权列表 - AI开发平台ModelArts

Finetune训练 - AI开发平台ModelArts

Notebook中无法打开“checkpoints”文件夹 - AI开发平台ModelArts

用户使用ma-cli制作自定义镜像失败，报错文件不存在（not found） - AI开发平台ModelArts

创建模型成功后，部署服务报错，如何排查代码问题 - AI开发平台ModelArts

查询专属资源池作业列表 - AI开发平台ModelArts

API概览 - AI开发平台ModelArts

Notebook运行代码报错，在'/tmp'中到不到文件 - AI开发平台ModelArts

请求超时返回Timeout - AI开发平台ModelArts

执行训练任务（历史版本） - AI开发平台ModelArts

查看批量服务的事件 - AI开发平台ModelArts

查看在线服务的事件 - AI开发平台ModelArts

单模型性能测试工具Mindspore lite benchmark - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

obsutil安装和配置 - AI开发平台ModelArts

使用自定义镜像创建训练作业找不到启动文件 - AI开发平台ModelArts

LoRA训练 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线