搜索_华为云

在运行finetune_ds.sh 时遇到报错 - AI开发平台ModelArts

将deepspeed配置文件的 stage3_prefetch_bucket_size 参数值从 auto 改成整数15099494 父主题：常见错误原因和解决方法

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法
GPU A系列裸金属服务器RoCE带宽不足如何解决？ - AI开发平台ModelArts

所以既然nccl-tests能正常测试，但是达不到预期，可能是nv_peer_mem异常。处理方法查看nv_peer_mem是否已安装。 dpkg -i | grep peer 如果未安装则需要安装，安装方法参考装机指导。如果已安装则进入下一检测项。查看该软件是否已经加载至内核。 lsmod

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
附录：大模型推理常见问题 - AI开发平台ModelArts

k/tokenizer/chatglm3-6b/config.json 问题3：使用离线推理时，性能较差或精度异常。解决方法：将block_size大小设置为128。 from vllm import LLM, SamplingParams llm = LLM(model="facebook/opt-125m"

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910）
mc2融合算子报错 - AI开发平台ModelArts

误。图1 mc2融合算子错误解决方法修改代码文件：AscendFactory/scripts_modellink/{model_name}/3_training.sh文件，去除以下mc2融合算子--mc2 父主题：常见错误原因和解决方法

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法
mc2融合算子报错 - AI开发平台ModelArts

误。图1 mc2融合算子错误解决方法修改代码文件：AscendFactory/scripts_modellink/{model_name}/3_training.sh文件，去除以下mc2融合算子--mc2 父主题：常见错误原因和解决方法

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法
创建ModelArts委托 - AI开发平台ModelArts

/v2/{project_id}/agency 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Body参数参数是否必选参数类型描述 agency_name_suffix 否 String

帮助中心 > AI开发平台ModelArts > API参考 > 授权管理
创建可视化作业 - AI开发平台ModelArts

Object 自动停止设置。参见表4。表3 flavor属性列表参数是否必选参数类型说明 code 是 String 可视化作业选择的资源规格编码。通过flavor接口获得。表4 schedule属性列表参数是否必选参数类型说明 type 是 String 设置为stop。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
时序预测-time_series_v2算法部署在线服务预测报错 - AI开发平台ModelArts

ies_v2训练时，超参：window设置为60。训练完成并创建模型后，部署在线服务，进行预测，当预测的数据行数小于window超参值时，日志中有报错信息：ERROR: data is shorter than windows 。处理方法增加预测数据行数大于训练作业window超参值。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
注册自定义镜像 - AI开发平台ModelArts

/v1/{project_id}/images 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID，获取方法请参见获取项目ID和名称。请求参数表2 请求Body参数参数是否必选参数类型描述 arch 否 String 该镜像所支持处理

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
在Linux上安装配置Grafana - AI开发平台ModelArts

购买弹性公网IP，并绑定到购买的弹性云服务器ECS上，具体操作请参见《弹性公网IP快速入门》。操作步骤将本地命令复制至ECS服务器请参考如下方法：在ECS桌面单击“复制粘贴”，使用快捷键“Ctrl+V”将命令粘贴至窗口中并单击“发送”，将复制的命令发送至命令行窗口，如下图所示。图3

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控 > 使用Grafana查看AOM中的监控指标 > 安装配置Grafana
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

准备数据本教程使用到的训练数据集是Alpaca数据集。您也可以自行准备数据集。数据集下载本教程使用Alpaca数据集，数据集的介绍及下载链接如下。 Alpaca数据集是由OpenAI的text-davinci-003引擎生成的包含52k条指令和演示的数据集。这些指令数据可以

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

准备镜像镜像方案说明 ECS获取和上传基础镜像 ECS中构建新镜像（可选）父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
重置节点后无法正常使用？ - AI开发平台ModelArts

重置节点后无法正常使用？问题现象当ModelArts Lite的CCE集群在资源池上只有一个节点，且用户设置了volcano为默认调度器时，在ModelArts侧进行重置节点的操作后，节点无法正常使用，节点上的POD会调度失败。原因分析在ModelArts侧进行节点重置后

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
在Dify中配置支持Function Calling的模型使用 - AI开发平台ModelArts

Function calling 设置为“Tool Call”。 Stream function calling 暂不支持。在Dify中创建Agent进行编排，在右上角单击“Agent 设置”，选择上一步配置好的模型进行使用。在Agent设置中可以看到Dify已自动将Agent

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 通过Function Calling扩展大语言模型交互能力
在JupyterLab中创建定时任务 - AI开发平台ModelArts

功能亮点一键运行：允许用户一键运行Notebook文件，无需逐个执行Cell。定时任务调度：允许用户设置定时执行代码块的时间和频率。支持秒、分钟、小时和每天/每周/月的时间设置。支持参数化执行：允许用户在运行时向Notebook传递参数，使得Notebook能根据不同需求调整行为。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
训练启动脚本说明和参数配置 - AI开发平台ModelArts

模型推荐的参数与NPU卡数设置不同模型推荐的训练参数和计算规格要求如表1所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表1 不同模型推荐的参数与NPU卡数设置序号支持模型支持模型参数量训练策略类型文本序列长度（SEQ_LEN）并行参数设置 micro

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

准备资源创建专属资源池本文档中的模型运行环境是ModelArts Standard，用户需要购买专属资源池，具体步骤请参考创建资源池。资源规格要求：计算规格：用户可参考表1。硬盘空间：至少200GB。昇腾资源规格： Ascend: 1*ascend-snt9b表示昇腾单卡。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
查看Lite Server服务器详情 - AI开发平台ModelArts

查看Lite Server服务器详情在您创建了Lite Server服务器后，可以通过管理控制台查看和管理您的Lite Server服务器。本节介绍如何查看Lite Server服务器的详细信息，包括名称/ID、规格、镜像等信息。在弹性节点Server的节点列表页中，可以查看

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
同步Lite Server服务器状态 - AI开发平台ModelArts

同步Lite Server服务器状态 Lite Server为一台弹性裸金属服务器，当用户在云服务器页面修改了裸金属服务器状态后，您可通过“同步”功能，同步其状态至ModelArts。登录ModelArts管理控制台。在左侧导航栏中，选择“AI专属资源池 > 弹性节点 Server”，进入“节点”列表页面。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
创建网络资源 - AI开发平台ModelArts

/v1/{project_id}/networks 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Body参数参数是否必选参数类型描述 apiVersion 是 String API版本。可选值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理

总条数： 1510

上一页
1
...
8
9
10
...
76
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在运行finetune_ds.sh 时遇到报错 - AI开发平台ModelArts

GPU A系列裸金属服务器RoCE带宽不足如何解决？ - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

mc2融合算子报错 - AI开发平台ModelArts

mc2融合算子报错 - AI开发平台ModelArts

创建ModelArts委托 - AI开发平台ModelArts

创建可视化作业 - AI开发平台ModelArts

时序预测-time_series_v2算法部署在线服务预测报错 - AI开发平台ModelArts

注册自定义镜像 - AI开发平台ModelArts

在Linux上安装配置Grafana - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

重置节点后无法正常使用？ - AI开发平台ModelArts

在Dify中配置支持Function Calling的模型使用 - AI开发平台ModelArts

在JupyterLab中创建定时任务 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

查看Lite Server服务器详情 - AI开发平台ModelArts

同步Lite Server服务器状态 - AI开发平台ModelArts

创建网络资源 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线