搜索_华为云

在ModelArts的Notebook中，如何使用昇腾多卡进行调试？ - AI开发平台ModelArts

在ModelArts的Notebook中，如何使用昇腾多卡进行调试？昇腾多卡训练任务是多进程多卡模式，跑几卡需要起几个python进程。昇腾底层会读取环境变量：RANK_TABLE_FILE，开发环境已经设置，用户无需关注。比如跑八卡，可以如下片段代码： export RANK_SIZE=8

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
服务韧性 - AI开发平台ModelArts
服务韧性 - AI开发平台ModelArts

ModelArts服务部署主机层、应用层、网络层和数据层的安全防护套件。及时检测主机层、应用层、网络层和数据层的安全入侵行为。 ModelArts服务涉及对互联网开放的Web应用，采用了统一推荐的Web安全组件防范Web安全风险，并且通过WAF进行安全防护。所有承载ModelArts服务的主机部署

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
发布ModelArts模型 - AI开发平台ModelArts

AI Gallery是在ModelArts的基础上构建的开发者生态社区，提供算法、模型、数据集等内容的共享，为高校科研机构、模型开发商、解决方案集成商、企业级个人开发者等群体，提供安全、开放的共享，加速AI资产的开发与落地。发布至AI Gallery的资产是免费的，只需要支付在

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理ModelArts模型
ECS中构建新镜像 - AI开发平台ModelArts

/multimodal_algorithm/QwenVL/train/<commit_id> 执行以下命令制作训练镜像。安装过程需要连接互联网git clone，请确保ECS可以访问公网 docker build -t <镜像名称>:<版本名称> . 图1 docker镜像构建过程

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 准备工作 > 准备镜像
ECS中构建新镜像 - AI开发平台ModelArts

/multimodal_algorithm/QwenVL/train/<commit_id> 执行以下命令制作训练镜像。安装过程需要连接互联网git clone，请确保ECS可以访问公网 docker build -t <镜像名称>:<版本名称> . 图1 docker镜像构建过程

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 准备工作 > 准备镜像
简介 - AI开发平台ModelArts
简介 - AI开发平台ModelArts

推理业务昇腾迁移整体流程及工具链图1 推理业务昇腾迁移整体路径推理业务昇腾迁移整体分为七个大的步骤，并以完整工具链覆盖全链路：迁移评估：针对迁移可行性、工作量，以及可能的性能收益进行大致的预估。环境准备：利用ModelArts提供的开发环境一键式准备好迁移、调测需要的运行环境与工具链。模型适配：针对昇腾迁移模型必要的转换和改造。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
训练日志失败分析 - AI开发平台ModelArts

如果训练作业运行失败，ModelArts会自动识别导致作业失败的原因，在训练日志界面上给出提示。提示包括三部分：失败的可能原因、推荐的解决方案以及对应的日志（底色标红部分）。图1 训练故障识别 ModelArts Standard会对部分常见训练错误给出分析建议，目前还不能识

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
模型训练存储加速 - AI开发平台ModelArts

针对AI训练场景中大模型Checkpoint保存和加载带来的I/O挑战，华为云提供了基于对象存储服务OBS+高性能弹性文件服务SFS Turbo的AI云存储解决方案，如下图所示。 SFS Turbo HPC型支持和OBS数据联动，您可以通过SFS Turbo HPC型文件系统来加速对OBS对象存储中

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
打开Notebook实例提示token不存在或者token丢失如何处理？ - AI开发平台ModelArts

打开Notebook实例提示token不存在或者token丢失如何处理？问题现象把已打开的Notebook url发送给他人使用，他人无法打开，报错“……lost token or incorrect token……”。原因分析原因是由于其他人没有此账号的令牌导致。解决方案在此url后面加上Notebook拥有者的token。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 实例故障
创建Notebook实例后无法打开页面，如何处理？ - AI开发平台ModelArts

创建Notebook实例后无法打开页面，如何处理？如果您在创建Notebook实例之后，打开Notebook时，因报错导致无法打开页面，您可以根据以下对应的错误码来排查解决。打开Notebook显示黑屏 Notebook打开后黑屏，由于代理问题导致，切换代理。打开Notebook显示空白

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 实例故障
报错“Connection permission denied (publickey)”如何解决 - AI开发平台ModelArts

报错“Connection permission denied (publickey)”如何解决问题现象 VS Code连接开发环境时报错“Connection permission denied (publickey). Please make sure the key file

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
Standard自动学习 - AI开发平台ModelArts

模型自动调优的自动学习功能，让零AI基础的业务开发者可快速完成模型的训练和部署。 ModelArts自动学习，为入门级用户提供AI零代码解决方案支持图片分类、物体检测、预测分析、声音分类场景自动执行模型开发、训练、调优和推理机器学习的端到端过程根据最终部署环境和开发者需求的推理速度，自动调优并生成满足要求的模型

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
推理精度测试 - AI开发平台ModelArts

本章节介绍如何使用opencompass工具开展语言模型的推理精度测试，数据集是ceval_gen、mmlu_gen、math_gen、gsm8k_gen、humaneval_gen。约束限制确保容器可以访问公网。当前的精度测试仅适用于语言模型精度验证，不适用于多模态模型的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909）
创建Notebook文件后，右上角的Kernel状态为“No Kernel”如何处理？ - AI开发平台ModelArts

态为“No Kernel”如何处理？问题现象现象：创建Notebook文件后，右上角的Kernel状态为“No Kernel”。原因分析可能因为用户工作目录下的code.py和创建kernel依赖的import code文件名称冲突。解决方案查看“/home/ma-u

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
Cluster资源池节点故障如何定位 - AI开发平台ModelArts

Cluster资源池节点故障如何定位故障说明和处理建议图1 Lite池故障处理流程对于ModelArts Lite资源池，每个节点会以DaemonSet方式部署node-agent组件，该组件会检测节点状态，并将检测结果写到K8S NodeCondtition中。同时，节点

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

准备镜像准备训练模型适用的容器镜像。微调训练 SFT全参微调介绍如何进行SFT全参微调，包括训练数据处理、超参配置、创建训练任务及性能查看。 LoRA微调训练介绍如何进行LoRA微调训练，包括训练数据处理、超参配置、创建训练任务及性能查看。父主题： Qwen-VL基于St

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912）
使用MobaXterm工具SSH连接Notebook后，经常断开或卡顿，如何解决？ - AI开发平台ModelArts

开或卡顿，如何解决？问题现象 MobaXterm成功连接到开发环境后，过一段时间会自动断开。可能原因配置MobaXterm工具时，没有勾选“SSH keepalive”或专业版MobaXterm工具的“Stop server after”时间设置太短。解决方案打开Mob

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
多模态模型推理性能测试 - AI开发平台ModelArts

多模态模型推理性能测试 benchmark方法介绍静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。性能benchmark验证使用到的脚本存放在代码包AscendCloud-LLM-xxx

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 推理性能测试
多模态模型推理性能测试 - AI开发平台ModelArts

多模态模型推理性能测试 benchmark方法介绍静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。性能benchmark验证使用到的脚本存放在代码包AscendCloud-LLM-xxx

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理性能测试
多模态模型推理性能测试 - AI开发平台ModelArts

多模态模型推理性能测试 benchmark方法介绍静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。性能benchmark验证使用到的脚本存放在代码包AscendCloud-LLM-xxx

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理性能测试

总条数： 1205

上一页
1
2
3
4
5
...
61
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在ModelArts的Notebook中，如何使用昇腾多卡进行调试？ - AI开发平台ModelArts

服务韧性 - AI开发平台ModelArts

发布ModelArts模型 - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

简介 - AI开发平台ModelArts

训练日志失败分析 - AI开发平台ModelArts

模型训练存储加速 - AI开发平台ModelArts

打开Notebook实例提示token不存在或者token丢失如何处理？ - AI开发平台ModelArts

创建Notebook实例后无法打开页面，如何处理？ - AI开发平台ModelArts

报错“Connection permission denied (publickey)”如何解决 - AI开发平台ModelArts

Standard自动学习 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

创建Notebook文件后，右上角的Kernel状态为“No Kernel”如何处理？ - AI开发平台ModelArts

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

使用MobaXterm工具SSH连接Notebook后，经常断开或卡顿，如何解决？ - AI开发平台ModelArts

多模态模型推理性能测试 - AI开发平台ModelArts

多模态模型推理性能测试 - AI开发平台ModelArts

多模态模型推理性能测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线