搜索_华为云

附录：大模型推理常见问题 - AI开发平台ModelArts

'original_max_position_embeddings': 8192, 'rope_type': 'llama3'} 解决方法：升级transformers版本到4.43.1：pip install transformers --upgrade 问题5：使用Smooth

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
附录：大模型推理常见问题 - AI开发平台ModelArts

'original_max_position_embeddings': 8192, 'rope_type': 'llama3'} 解决方法：升级transformers版本到4.43.1：pip install transformers --upgrade 问题5：使用Smooth

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908）
附录：Standard大模型推理常见问题 - AI开发平台ModelArts

'original_max_position_embeddings': 8192, 'rope_type': 'llama3'} 解决方法：升级transformers版本到4.43.1：pip install transformers --upgrade 问题5：使用Smooth

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
使用ModelArts VSCode插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

本地调测'local'或云端资源规格。每个region的资源规格可能是不同的，可以通过下述说明查询对应的资源规格信息。 train_instance_count 节点数 log_url 日志输出路径 job_name 作业名称，不可以重复 train_instance_type表示训练的资源规格，每个r

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard开发环境
报错“The VS Code Server failed to start”如何解决？ - AI开发平台ModelArts

问题现象解决方法检查VS Code版本是否为1.78.2或更高版本，如果是，请查看Remote-SSH版本，如果低于v0.76.1，请升级Remote-SSH。打开命令面板（Windows： Ctrl+Shift+P，macOS：Cmd+Shift+P），搜索“Kill VS

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
Open-Clip基于Lite Server适配PyTorch NPU训练指导 - AI开发平台ModelArts

训练的详细过程。完成本方案的部署，需要先联系您所在企业的华为方技术支持购买Lite Server资源。本方案目前仅适用于企业客户。资源规格要求推荐使用“西南-贵阳一”Region上的Lite Server资源和Ascend Snt9B单机单卡。表1 环境要求模型版本 CANN

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
在Linux上安装配置Grafana - AI开发平台ModelArts

本章节适用于在Linux操作系统的PC中安装配置Grafana。前提条件一台可访问外网的Ubuntu服务器。如果没有请具备以下条件：准备一台ECS服务器（建议规格选8U或者以上，镜像选择Ubuntu，建议选择22.04版本，本地存储100G），具体操作请参考《购买弹性云服务器》。购买弹性公网IP，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控 > 使用Grafana查看AOM中的监控指标 > 安装配置Grafana
在JupyterLab中使用TensorBoard可视化作业 - AI开发平台ModelArts

TensorBoard可视化训练作业，当前仅支持基于TensorFlow、PyTorch版本镜像，CPU/GPU规格的资源类型。请根据实际局点支持的镜像和资源规格选择使用。前提条件为了保证训练结果中输出Summary文件，在编写训练脚本时，您需要在脚本中添加收集Summary相关代码。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

保持默认。计算节点规格：根据您的实际需求选择相应的规格，不同规格的配置费用不同，选择好规格后，配置费用处会显示相应的费用。是否自动停止：为了避免资源浪费，建议您打开该开关，根据您的需求，选择自动停止时间，也可以自定义自动停止的时间。图2 选择计算节点规格图3 设置自动停止

 帮助中心 > AI开发平台ModelArts > 快速入门
使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

保持默认。计算节点规格：根据您的实际需求选择相应的规格，不同规格的配置费用不同，选择好规格后，配置费用处会显示相应的费用。是否自动停止：为了避免资源浪费，建议您打开该开关，根据您的需求，选择自动停止时间，也可以自定义自动停止的时间。图2 选择计算节点规格图3 设置自动停止

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard自动学习
图模式 - AI开发平台ModelArts
图模式 - AI开发平台ModelArts

A模式下，会根据服务启动时的max_num_seqs参数对档位进行调整，使得最终的最大档位为max_num_seqs，因此，请根据使用场景合理设置动态分档以及max_num_seqs参数，避免档位过大导致图编译错误。 MoE模型依赖MindSpeed，当使用MoE模型推理时，需提前安装：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
创建训练作业参数 - AI开发平台ModelArts

当为自定义镜像训练作业的时候，此参数为容器环境变量。详细请参见表4 spec_id 是 Long 训练作业选择的资源规格ID。请从查询作业资源规格接口获取资源规格ID。 data_url 否 String 训练作业需要的数据集OBS URL。如：“/usr/data/”。不可与

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置
ModelArts在线服务预测时，如何提高预测速度？ - AI开发平台ModelArts

ModelArts在线服务预测时，如何提高预测速度？部署在线服务时，您可以选择性能更好的“实例规格”提高预测速度。例如使用GPU资源代替CPU资源。部署在线服务时，您可以增加“实例数”。如果实例数设置为1，表示后台的计算模式是单机模式；如果实例数设置大于1，表示后台的计算模

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
训练作业日志中提示“No module named .*” - AI开发平台ModelArts

ImportError: No module named npu_bridge.npu_init 检查下训练作业使用的规格是否支持NPU，有可能是训练时使用了GPU规格，导致发生了NPU相关调用报错。建议与总结在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

用户选择了1/2/4卡这些规格的作业，然后设置了CUDA_VISIBLE_DEVICES=‘1’这种类似固定的卡ID号，与实际选择的卡ID不匹配。处理方法尽量代码里不要去修改CUDA_VISIBLE_DEVICES变量，用系统默认里面自带的。如果必须指定卡ID，需要注意1/2/4规格下，指定

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
管理Standard专属资源池 - AI开发平台ModelArts

管理Standard专属资源池查看Standard专属资源池详情扩缩容Standard专属资源池升级Standard专属资源池驱动修复Standard专属资源池故障节点修改Standard专属资源池支持的作业类型迁移Standard专属资源池和网络至其他工作空间配置Standard专属资源池可访问公网

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

方法四：使用Git clone，官方提供了git clone repo_url的方式下载，但是不支持断点续传，并且clone会下载历史版本占用磁盘空间。模型软件包结构说明本教程需要使用到的AscendCloud-6.3.912中的AscendCloud-LLM-xxx.zip

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

方法四：使用Git clone，官方提供了 git clone repo_url 的方式下载，但是不支持断点续传，并且clone 会下载历史版本占用磁盘空间。模型软件包结构说明本教程需要使用到的AscendCloud-6.3.912中的AscendCloud-LLM-xxx.zip

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
使用Prometheus查看Lite Cluster监控指标 - AI开发平台ModelArts

标数据。开通前需要确认使用的端口号，端口号可选取10120~10139范围内的任一端口号，请确认选取的端口号在各个节点上都没有被其他应用占用。 Kubernetes下Prometheus对接ModelArts 使用kubectl连接集群，详细操作请参考通过kubectl连接集群。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理 > 监控Lite Cluster资源
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

方法四：使用Git clone，官方提供了 git clone repo_url 的方式下载，但是不支持断点续传，并且clone 会下载历史版本占用磁盘空间。模型软件包结构说明本教程需要使用到的AscendCloud-6.3.911中的AscendCloud-LLM-xxx.zip

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作

总条数： 822

上一页
1
...
27
28
29
...
42
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

附录：大模型推理常见问题 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

附录：Standard大模型推理常见问题 - AI开发平台ModelArts

使用ModelArts VSCode插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

报错“The VS Code Server failed to start”如何解决？ - AI开发平台ModelArts

Open-Clip基于Lite Server适配PyTorch NPU训练指导 - AI开发平台ModelArts

在Linux上安装配置Grafana - AI开发平台ModelArts

在JupyterLab中使用TensorBoard可视化作业 - AI开发平台ModelArts

使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

图模式 - AI开发平台ModelArts

创建训练作业参数 - AI开发平台ModelArts

ModelArts在线服务预测时，如何提高预测速度？ - AI开发平台ModelArts

训练作业日志中提示“No module named .*” - AI开发平台ModelArts

日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

管理Standard专属资源池 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

使用Prometheus查看Lite Cluster监控指标 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线