搜索_华为云

如何在ModelArts的Notebook中上传下载OBS文件？ - AI开发平台ModelArts

ensorFlow、PyTorch等之上，使用MoXing API可让模型代码的编写更加简单、高效。 MoXing提供了一套文件对象API，可以用来读写OBS文件。您可以通过MoXing API文档了解其与原生API对应关系，以及详细的接口调用示例，详细说明请参见MoXing文件操作。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
msprobe精度分析工具使用指导 - AI开发平台ModelArts

数示例：mode=True。默认值：False。即使在相同的硬件和输入下，API多次执行的结果也可能不同，开启确定性计算是为了保证在相同的硬件和输入下，API多次执行的结果相同。确定性计算会导致API执行性能降低，通常不需要在精度问题刚开始定位时就开启，而是建议在发现模型多次执行结果不同的情况下时再开启。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

LLama-Factory ShareGPT 指令微调数据：ShareGPT 格式来源于通过记录 ChatGPT 与用户对话的数据集，主要用于对话系统的训练。它更侧重于多轮对话数据的收集和组织，模拟用户与 AI 之间的交互。数据集包含有以下字段： conversations：包含一系列对话对象，每个

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
精度校验 - AI开发平台ModelArts
精度校验 - AI开发平台ModelArts

putShapes可将模型放入到netron官网中查看。图1 benchmark对接结果输出示例图为了简化用户使用，ModelArts提供了Tailor工具便于用户进行Benchmark精度测试，具体使用方式参考Tailor指导文档。父主题： GPU推理业务迁移至昇腾的通用指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
日志提示“no socket interface found” - AI开发平台ModelArts

IMEOUT，因此会导致通信速度慢且不稳定，最后造成IB通信断连，偶发上述现象。原因2：NCCL_SOCKET_IFNAME设置错误。当用户的NCCL版本低于2.14时，则需要手动设置NCCL_SOCKET_IFNAME环境变量。处理方法针对原因1，需要在代码中补充如下环境变量。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
模型使用CV2包部署在线服务报错 - AI开发平台ModelArts

需要您把CV2包制作为自定义镜像，上传至容器镜像服务（SWR），选择从容器镜像中导入元模型，部署在线服务。如何制作自定义镜像请参考从0-1制作自定义镜像并创建AI应用。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
ModelArts在线服务处于运行中时，如何填写request header和request body？ - AI开发平台ModelArts

ion的domain级别的token。具体指导参见链接：获取IAM用户Token。 APP认证的方式：APP认证方式又可以细分为AppCode认证和APP签名认证。 AppCode认证需要在header的X-Apig-AppCode字段上填入绑定给该在线服务的APP的AppCode。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
报错“Connection permission denied (publickey)”如何解决 - AI开发平台ModelArts

不正确等，请按以下步骤排查。解决方案排查/home/ma-user权限，建议将该目录权限设置为755或750，权限不能过于宽松，以保证用户隔离和安全。修改方法如下。 chomd 755 /home/ma-user chomd 750 /home/ma-user 排查密钥是否是和实例绑定的一致。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
如何保证训练和调试时文件路径保持一致 - AI开发平台ModelArts

如果代码中涉及文件绝对路径，由于Notebook调试与训练作业环境不同，可能会导致文件绝对路径不一致，需要修改代码内容。推荐使用软链接的方式解决该问题，用户只需提前建立好软链接，代码中的地址可保持不变。新建软链接： # ln -s 源目录/文件目标目录/文件 # 例如 ln -s /mnt

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ
Manifest管理概述 - AI开发平台ModelArts

具备UTF-8处理能力。 Manifest文件中文本分类的source数值可以包含中文，其他字段不建议用中文。 Manifest文件可以由用户、第三方工具或ModelArts标注系统生成。 Manifest文件名没有特殊要求，可以为任意合法文件名。父主题： Manifest管理

 帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > Manifest管理
训练性能测试 - AI开发平台ModelArts

yaml相对或绝对路径，此配置文件为训练最优配置参数。 --baseline <baseline>：<可选>GP-Ant8机器性能基线yaml文件路径，用户可自行修改，不填则使用工具自带基线配置，默认基线配置样例如下： --o <output_dir>： <可选>任务完成输出excel表格路径，默认为"

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 训练benchmark工具
在ModelArts的Notebook中，如何访问其他账号的OBS桶？ - AI开发平台ModelArts

号授予桶的读写权限指导，授予当前账号OBS桶的读写权限。此操作指导是某一华为云账号将其OBS桶权限授予其他华为云账号。如果您的账号是IAM用户或其他场景时，请参见《OBS权限配置指南》> 典型场景配置案例，查找授予OBS桶权限的指导。获得OBS桶的读写权限后，您可以在Note

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
ModelArts环境挂载目录说明 - AI开发平台ModelArts

备注 /xxx 否专属池使用SFS盘挂载的目录，路径由客户自己指定。 /home/ma-user/modelarts 否空文件夹，建议用户主要用这个目录。 /cache 否裸机规格支持，挂载宿主机NVMe的硬盘。 /dev/shm 否用于PyTorch引擎加速。 /usr/local/nvidia

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ
开发环境计费项 - AI开发平台ModelArts

计费示例以下案例中出现的费用价格仅供参考，实际价格请参见各服务价格详情。示例：使用公共资源池。计费项：计算资源费用 + EVS存储费用假设用户于2023年4月1日10:00:00创建了一个Notebook实例，使用规格为CPU: 8 核 32GB、计算节点个数为1个的公共资源池和磁盘规格为5GB的运行盘（总计单价：3

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
精度问题概述 - AI开发平台ModelArts

为了更好地了解这种计算差异，并且能够正确区分正常计算差异和引起模型精度问题的异常差异，本指南提供了算子问题定位工具集详细的使用场景和使用步骤，方便用户自行或在支持下排查可能的数值计算精度问题。当用户将大语言模型或者其他类型深度神经网络的训练从GPU迁移到昇腾AI处理器时，可能出现以下不同现象的模型精度问题。一般包括：

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
自动学习生成的模型，存储在哪里？支持哪些其他操作？ - AI开发平台ModelArts

在自动学习页面中，仅支持部署为在线服务，如需部署为批量服务或边缘服务，可在“模型部署”页面部署。支持发布至市场将产生的模型发布至AI Gallery，共享给其他用户。支持创建新版本创建新版本，仅支持从ModelArts训练作业、OBS、模型模板、或自定义镜像中选择元模型。无法从原自动学习项目中，创建新版本。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习
简介 - AI开发平台ModelArts
简介 - AI开发平台ModelArts

模型准备，导出和保存确定格式的模型。转换参数准备，准备模型业务相关的关键参数。模型转换，包含模型转换、优化和量化等。应用集成。针对转换的模型运行时应用层适配。数据预处理。模型编排。模型裁剪。精度校验。精度对比误差统计工具。自动化精度对比工具。网络结构可视化工具。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
BF16和FP16说明 - AI开发平台ModelArts

训练中提供了优势。而FP16则在计算效率和内存使用方面有其独特的优点，但可能在数值范围和稳定性方面略逊一筹。因此，选择哪种格式取决于具体的应用场景和训练需求。父主题：训练脚本说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练脚本说明
BF16和FP16说明 - AI开发平台ModelArts

训练中提供了优势。而FP16则在计算效率和内存使用方面有其独特的优点，但可能在数值范围和稳定性方面略逊一筹。因此，选择哪种格式取决于具体的应用场景和训练需求。父主题：训练脚本说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 训练脚本说明
模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

*节点 & 4*Ascend表示单机4卡，以此类推。表1 NPU卡数、加速框架、梯度配置取值表模型 Template 模型参数量训练策略类型序列长度cutoff_len 梯度累积值优化工具(Deepspeed) 规格与节点数 llama2 llama2 7B lora 4096/8192

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 训练脚本说明

总条数： 2247

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何在ModelArts的Notebook中上传下载OBS文件？ - AI开发平台ModelArts

msprobe精度分析工具使用指导 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

精度校验 - AI开发平台ModelArts

日志提示“no socket interface found” - AI开发平台ModelArts

模型使用CV2包部署在线服务报错 - AI开发平台ModelArts

ModelArts在线服务处于运行中时，如何填写request header和request body？ - AI开发平台ModelArts

报错“Connection permission denied (publickey)”如何解决 - AI开发平台ModelArts

如何保证训练和调试时文件路径保持一致 - AI开发平台ModelArts

Manifest管理概述 - AI开发平台ModelArts

训练性能测试 - AI开发平台ModelArts

在ModelArts的Notebook中，如何访问其他账号的OBS桶？ - AI开发平台ModelArts

ModelArts环境挂载目录说明 - AI开发平台ModelArts

开发环境计费项 - AI开发平台ModelArts

精度问题概述 - AI开发平台ModelArts

自动学习生成的模型，存储在哪里？支持哪些其他操作？ - AI开发平台ModelArts

简介 - AI开发平台ModelArts

BF16和FP16说明 - AI开发平台ModelArts

BF16和FP16说明 - AI开发平台ModelArts

模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线