搜索_华为云

查看训练作业日志 - AI开发平台ModelArts

训练日志用于记录训练作业运行过程和异常信息，为快速定位作业运行中出现的问题提供详细信息。用户代码中的标准输出、标准错误信息会在训练日志中呈现。在ModelArts中训练作业遇到问题时，可首先查看日志，多数场景下的问题可以通过日志报错信息直接定位。训练日志包括普通训练日志和Ascend相关日志。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
迁移环境准备 - AI开发平台ModelArts

的替换驱动、固件和上层开发包，具有root权限，结合配置指导、初始化工具及容器镜像可以快速搭建昇腾开发环境。开通裸金属服务器资源请见DevServer资源开通，在裸金属服务器上搭建迁移环境请见裸金属服务器环境配置指导，使用ModelArts提供的基础容器镜像请见容器环境搭建。父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
修复Standard专属资源池故障节点 - AI开发平台ModelArts

Standard专属资源池支持对故障节点进行修复操作，目前提供了替换节点、高可用冗余节点、重置节点和重启节点等方式。华为云技术支持在故障定位和性能诊断时，部分运维操作需要用户授权才可进行，本章节同时也介绍了如何进行授权操作。故障节点处理方式替换节点：替换节点后，节点名称会发生变化。原有节点会被释放掉。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
日志提示“ Network is unreachable” - AI开发平台ModelArts

unreachable” 问题现象在使用pytorch时，将torchvision.models中的pretrained置为了True，日志中出现如下报错： ‘OSError: [Errno 101] Network is unreachable’ 原因分析出现该问题的可能原因如下：

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 外网访问限制
系统容器异常退出 - AI开发平台ModelArts

bucket not found. 原因分析出现该问题的可能原因如下： OBS相关错误。 OBS文件不存在。The specified key does not exist。用户OBS权限不足。 OBS限流。 OBS其他问题。磁盘空间不足。处理方法如果是OBS相关错误。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
使用PyCharm上传数据至Notebook - AI开发平台ModelArts

n环境 python #使用moxing import moxing as mox #下载一个OBS文件夹，从OBS下载至EVS（OBS -> EVS） mox.file.copy_parallel('obs://bucket_name/sub_dir_0', '/tmp/sub_dir_0')

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过PyCharm远程使用Notebook实例
推理业务迁移评估表 - AI开发平台ModelArts

例如：使用了C83版本。 - 性能指标与预期例1：模型：YOLOv5 运行环境：Vnt1 单卡性能指标：QPS 100/s （两进程）性能约束：单次请求最大可以接受时延需小于100ms 性能预期：QPS 130/s 例2：模型：OCR 运行环境：6348（单核48U超线程）性能指标：QPS

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
多节点训练TensorFlow框架ps节点作为server会一直挂着，ModelArts是怎么判定训练任务结束？如何知道是哪个节点是worker呢？ - AI开发平台ModelArts

多节点训练TensorFlow框架ps节点作为server会一直挂着，ModelArts是怎么判定训练任务结束？如何知道是哪个节点是worker呢？ TensorFlow框架分布式训练的情况下，会启动ps与worker任务组，worker任务组为关键任务组，会以worker任务组的进程退出码，判断训练作业是否结束。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 功能咨询
迁移环境准备 - AI开发平台ModelArts

样例演示可参考Notebook样例：Stable Diffusion模型迁移到Ascend上进行推理。方式二 ModelArts Lite DevServer：该环境为裸机开发环境，主要面向深度定制化开发场景。优点：支持深度自定义环境安装，可以方便的替换驱动、固件和上层开发包，具有r

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
在推理生产环境中部署推理服务 - AI开发平台ModelArts

"temperature":0}”，单击“预测”既可看到预测结果。图9 预测-openai 在线服务的更多内容介绍请参见文档查看服务详情。 Step5 推理性能测试推理性能测试操作请参见推理性能测试。父主题：主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
在推理生产环境中部署推理服务 - AI开发平台ModelArts

"temperature":0}”，单击“预测”既可看到预测结果。图5 预测-openai 在线服务的更多内容介绍请参见文档查看服务详情。 Step5 推理性能测试推理性能测试操作请参见推理性能测试。父主题：主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
如何处理使用opencv.imshow造成的内核崩溃？ - AI开发平台ModelArts

imshow造成的内核崩溃？问题现象当在Notebook中使用opencv.imshow后，会造成Notebook崩溃。原因分析 opencv的cv2.imshow在jupyter这样的client/server环境下存在问题。而matplotlib不存在这个问题。解决方法参考如

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
训练运行报错AttributeError: 'torch_npu._C._NPUDeviceProperties' object has no attribute 'multi_processor_count' - AI开发平台ModelArts

_NPUDeviceProperties' object has no attribute 'multi_processor_count' 问题现象训练运行报错“AttributeError: 'torch_npu._C._NPUDeviceProperties' object has

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于LLM模型的GPU训练业务迁移至昇腾指导 > 常见问题
Notebook使用场景 - AI开发平台ModelArts

Code远程使用Notebook实例、通过SSH工具远程使用Notebook。在AI开发过程中，如何将文件方便快速地上传到Notebook几乎是每个开发者都会遇到的问题。ModelArts提供了多种文件上传方式，在文件上传过程中，可以查看上传进度和速度。将本地文件上传，请参考支持上传本地文件； GitH

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
在推理生产环境中部署推理服务 - AI开发平台ModelArts

查看详细耗时日志可以辅助定位性能瓶颈，但会影响推理性能。如需开启，配置以下环境变量。 export DETAIL_TIME_LOG=1 export RAY_DEDUP_LOGS=0 关闭详细日志命令： unset DETAIL_TIME_LOG 配置后重启推理服务生效。 Step6 推理性能和精度测试

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
ModelArts入门指引 - AI开发平台ModelArts

ModelArts入门指引本文旨在帮助您了解ModelArts的基本使用流程以及相关的常见问题，帮助您快速上手ModelArts服务。面向不同AI基础的开发者，本文档提供了相应的入门教程，帮助用户更快速地了解ModelArts的功能，您可以根据经验选择相应的教程。面向AI开

 帮助中心 > AI开发平台ModelArts > 快速入门
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

├──benchmark_tools #性能评测 ├── benchmark.py # 可以基于默认的参数跑完静态benchmark和动态benchmark ├── benchmark_parallel.py # 评测静态性能脚本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

├──benchmark_tools #性能评测 ├── benchmark.py # 可以基于默认的参数跑完静态benchmark和动态benchmark ├── benchmark_parallel.py # 评测静态性能脚本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 准备工作
调用transformers出现ImportError: Using the `Trainer` with `PyTorch` requires `accelerate`: Run `pip install --upgrade accelerate` - AI开发平台ModelArts

`PyTorch` requires `accelerate`: Run `pip install --upgrade accelerate` 问题现象调用transformers出现ImportError: Using the `Trainer` with `PyTorch` requires

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于LLM模型的GPU训练业务迁移至昇腾指导 > 常见问题
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

├──benchmark_tools #性能评测 ├── benchmark.py # 可以基于默认的参数跑完静态benchmark和动态benchmark ├── benchmark_parallel.py # 评测静态性能脚本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 准备工作

总条数： 1439

上一页
1
...
43
44
45
...
72
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查看训练作业日志 - AI开发平台ModelArts

迁移环境准备 - AI开发平台ModelArts

修复Standard专属资源池故障节点 - AI开发平台ModelArts

日志提示“ Network is unreachable” - AI开发平台ModelArts

系统容器异常退出 - AI开发平台ModelArts

使用PyCharm上传数据至Notebook - AI开发平台ModelArts

推理业务迁移评估表 - AI开发平台ModelArts

多节点训练TensorFlow框架ps节点作为server会一直挂着，ModelArts是怎么判定训练任务结束？如何知道是哪个节点是worker呢？ - AI开发平台ModelArts

迁移环境准备 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

如何处理使用opencv.imshow造成的内核崩溃？ - AI开发平台ModelArts

训练运行报错AttributeError: 'torch_npu._C._NPUDeviceProperties' object has no attribute 'multi_processor_count' - AI开发平台ModelArts

Notebook使用场景 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

ModelArts入门指引 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

调用transformers出现ImportError: Using the `Trainer` with `PyTorch` requires `accelerate`: Run `pip install --upgrade accelerate` - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线