搜索_华为云

批量更新样本标签 - AI开发平台ModelArts

表1 路径参数参数是否必选参数类型描述 dataset_id 是 String 数据集ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Body参数参数是否必选参数类型描述 email 否 String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
LoRA微调训练 - AI开发平台ModelArts

八卡规格。当前功能还处于试验阶段，只有llama3-8B/70B适配。 Step5 其他配置选择用户自己的专属资源池，以及规格与节点数。防止训练过程中出现内存溢出的情况，用户可参考表1进行配置。图3 选择资源池规格作业日志选择OBS中的路径，训练作业的日志信息则保存该路径下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911）
训练过程中无法找到so文件 - AI开发平台ModelArts

训练过程中无法找到so文件问题现象 ModelArts训练作业运行时，日志中遇到如下报错，导致训练失败： libcudart.so.9.0 cannot open shared object file no such file or directory 原因分析编译生成s

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
日志提示“no socket interface found” - AI开发平台ModelArts

IMEOUT，因此会导致通信速度慢且不稳定，最后造成IB通信断连，偶发上述现象。原因2：NCCL_SOCKET_IFNAME设置错误。当用户的NCCL版本低于2.14时，则需要手动设置NCCL_SOCKET_IFNAME环境变量。处理方法针对原因1，需要在代码中补充如下环境变量。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
精度校验 - AI开发平台ModelArts
精度校验 - AI开发平台ModelArts

putShapes可将模型放入到netron官网中查看。图1 benchmark对接结果输出示例图为了简化用户使用，ModelArts提供了Tailor工具便于用户进行Benchmark精度测试，具体使用方式参考Tailor指导文档。父主题： GPU推理业务迁移至昇腾的通用指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

八卡规格。当前功能还处于试验阶段，只有llama3-8B/70B适配。 Step5 其他配置选择用户自己的专属资源池，以及规格与节点数。防止训练过程中出现内存溢出的情况，用户可参考表1进行配置。图3 选择资源池规格作业日志选择OBS中的路径，训练作业的日志信息则保存该路径下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911）
SFT全参微调训练 - AI开发平台ModelArts

八卡规格。当前功能还处于试验阶段，只有llama3-8B/70B适配。 Step5 其他配置选择用户自己的专属资源池，以及规格与节点数。防止训练过程中出现内存溢出的情况，用户可参考表1进行配置。图4 选择资源池规格作业日志选择OBS中的路径，训练作业的日志信息则保存该路径下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911）
查询处理任务列表 - AI开发平台ModelArts

/v2/{project_id}/processor-tasks 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 limit 否 Integer 指定每一页返回的最大条目数，取值范围[1

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
Notebook中已安装对应库，仍报错import numba ModuleNotFoundError: No module named 'numba' - AI开发平台ModelArts

numba命令安装了numba库且运行正常（且已保存为自定义镜像），然后使用DataArts执行此脚本的任务时提示没有这个库。原因分析客户创建了多个虚拟环境，numba库安装在了python-3.7.10中，如图1所示。图1 查询创建的虚拟环境解决方案在Terminal中执行conda

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 环境配置故障
Prefix Caching - AI开发平台ModelArts

Ascend vllm提供prefix caching关键特性能力，能够显著降低长system prompt和多轮对话场景首token时延，提升用户体验。其优势主要包括：更短的prefill时间：由于跨请求的重复token序列对应的KV Cache可以复用，那么就可以减少一部分前缀token的KV

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
模型适配 - AI开发平台ModelArts
模型适配 - AI开发平台ModelArts

/configs/unet.ini 最多支持100档配置，每一档通过英文逗号分隔。如果用户设置的dim数值过大或档位过多，可能会导致模型编译失败，此时建议用户减少档位或调低档位数值。如果用户设置了动态维度，实际推理时，使用的输入数据的shape需要与设置的档位相匹配。父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 应用迁移
在ModelArts Standard上运行GPU单机单卡训练作业 - AI开发平台ModelArts

针对调试中遇到的错误，可以直接在容器实例里修改，修改结果可以通过commit命令持久化。上传镜像客户端上传镜像，是指在安装了容器引擎客户端的机器上使用docker命令将镜像上传到容器镜像服务的镜像仓库。如果容器引擎客户端机器为云上的ECS或CCE节点，根据机器所在区域有两种网络链路可以选择：如

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
MaaS大模型即服务平台功能介绍 - AI开发平台ModelArts

行微调或直接应用，减轻了模型集成的负担。零代码、免配置、免调优模型开发平台结合与100+客户适配、调优开源大模型的行业实践经验，沉淀了大量适配昇腾，和调优推理参数的最佳实践。通过为客户提供一键式训练、自动超参调优等能力，和高度自动化的参数配置机制，使得模型优化过程不再依赖于手

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍
环境准备 - AI开发平台ModelArts
环境准备 - AI开发平台ModelArts

接使用。开发者可以通过浏览器入口以Notebook方式访问，也可以通过VSCode远程开发的模式直接接入到云上环境中完成迁移开发与调测，最终生成适配昇腾的推理应用。当前支持以下两种迁移环境搭建方式： ModelArts Standard：在Notebook中，使用预置镜像进行。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
报错“Connection permission denied (publickey)”如何解决 - AI开发平台ModelArts

不正确等，请按以下步骤排查。解决方案排查/home/ma-user权限，建议将该目录权限设置为755或750，权限不能过于宽松，以保证用户隔离和安全。修改方法如下。 chomd 755 /home/ma-user chomd 750 /home/ma-user 排查密钥是否是和实例绑定的一致。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
服务预测失败 - AI开发平台ModelArts

服务预测失败问题现象在线服务部署完成且服务已经处于“运行中”的状态，向服务发起推理请求，预测失败。原因分析及处理方法服务预测需要经过客户端、外部网络、APIG、Dispatch、模型服务多个环节。每个环节出现都会导致服务预测失败。图1 推理服务流程图出现APIG.XXX

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
镜像过大，卸载原来的包重新打包镜像，最终镜像会变小吗？ - AI开发平台ModelArts

镜像过大，卸载原来的包重新打包镜像，最终镜像会变小吗？不会，反而会变大。因为Docker镜像的层原因，当前的镜像是基于原来的镜像制作，而原来的镜像层数是无法改变的，层不变的情况下，大小是不变的，卸载包或者删除数据集，会新增镜像层，镜像反而会变大，这和传统概念的存储不一样。父主题：

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard镜像相关
使用AppCode认证鉴权方式进行在线预测 - AI开发平台ModelArts

APPcode认证是一种简易的API调用认证方式，通过在HTTP请求头中添加参数X-Apig-AppCode来实现身份认证，无需复杂的签名过程，适合于客户端环境安全可控的场景，如内网系统之间的API调用。在ModelArts中，支持在部署在线服务时开启AppCode认证（部署模型为在线服务中

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
查询训练作业详情 - AI开发平台ModelArts

Long 训练作业创建时间戳，单位为毫秒，创建成功后由ModelArts生成返回，无需填写。 user_name String 训练作业创建用户的用户名，创建成功后由ModelArts生成返回，无需填写。 annotations Map<String,String> 训练作业申明模板，

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
查询训练作业的运行指标 - AI开发平台ModelArts

查询训练作业的运行指标示例代码在ModelArts notebook平台，Session鉴权无需输入鉴权参数。其它平台的Session鉴权请参见Session鉴权。方式一：根据指定的job_id查询。 from modelarts.session import Session

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业

总条数： 2007

上一页
1
...
87
88
89
...
101
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

批量更新样本标签 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

训练过程中无法找到so文件 - AI开发平台ModelArts

日志提示“no socket interface found” - AI开发平台ModelArts

精度校验 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

查询处理任务列表 - AI开发平台ModelArts

Notebook中已安装对应库，仍报错import numba ModuleNotFoundError: No module named 'numba' - AI开发平台ModelArts

Prefix Caching - AI开发平台ModelArts

模型适配 - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机单卡训练作业 - AI开发平台ModelArts

MaaS大模型即服务平台功能介绍 - AI开发平台ModelArts

环境准备 - AI开发平台ModelArts

报错“Connection permission denied (publickey)”如何解决 - AI开发平台ModelArts

服务预测失败 - AI开发平台ModelArts

镜像过大，卸载原来的包重新打包镜像，最终镜像会变小吗？ - AI开发平台ModelArts

使用AppCode认证鉴权方式进行在线预测 - AI开发平台ModelArts

查询训练作业详情 - AI开发平台ModelArts

查询训练作业的运行指标 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线