搜索_华为云

通过JupyterLab在线使用Notebook实例进行AI开发 - AI开发平台ModelArts

通过JupyterLab在线使用Notebook实例进行AI开发使用JupyterLab在线开发和调试代码 JupyterLab常用功能介绍在JupyterLab使用Git克隆代码仓上传文件至JupyterLab 下载JupyterLab文件到本地在JupyterLab中使用MindInsight可视化作业

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908） - AI开发平台ModelArts

PyTorch NPU训练指导（6.3.908）场景介绍准备工作执行预训练任务执行SFT全参微调训练任务执行LoRA微调训练任务查看日志和性能训练脚本说明参考常见错误原因和解决方法父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

PyTorch NPU训练指导（6.3.909）场景介绍准备工作执行预训练任务执行SFT全参微调训练任务执行LoRA微调训练任务查看日志和性能训练脚本说明参考常见错误原因和解决方法父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
线下容器镜像构建及调试 - AI开发平台ModelArts

环境变量）。测试训练启动脚本。优先使用手工进行数据复制的工作并验证一般在镜像里不包含训练所用的数据和代码，所以在启动镜像以后需要手工把需要的文件复制进去。建议数据、代码和中间数据都放到"/cache"目录，防止正式运行时磁盘占满（请见ModelArts环境挂载目录说明）。建

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
分离部署推理服务 - AI开发平台ModelArts

"software|firmware" #查看驱动和固件版本如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。驱动版本要求是23.0.6。如果不符合要求请参考安装固件和驱动章节升级驱动。检查docker是否安装。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

创建预测分析自动学习项目时，对训练数据有什么要求？使用从OBS选择的数据创建表格数据集如何处理Schema信息？物体检测或图像分类项目支持对哪些格式的图片进行标注和训练？父主题： Standard自动学习

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习
主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

在Notebook调试环境中部署推理服务在推理生产环境中部署推理服务推理精度测试推理性能测试推理模型量化附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理standard常见问题父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

在Notebook调试环境中部署推理服务在推理生产环境中部署推理服务推理精度测试推理性能测试推理模型量化附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：Standard大模型推理常见问题父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） - AI开发平台ModelArts

在Notebook调试环境中部署推理服务在推理生产环境中部署推理服务推理精度测试推理性能测试推理模型量化附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：Standard大模型推理常见问题父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
创建图像分类数据集并进行标注任务 - AI开发平台ModelArts

确认服务的部署区域，获取项目名称和ID、获取帐号名和ID和获取用户名和ID。已经准备好数据源，例如存放在OBS的“/test-obs/classify/input/cat-dog/”目录下。已经准备好数据集的输出位置，用于存放输出的标注信息等文件，例如“/test-obs/classify/output/”。

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
上传OBS文件到JupyterLab - AI开发平台ModelArts

OBS路径没有设置为具体的文件路径，设置成了文件夹。 OBS中的文件设置了加密。请前往OBS控制台查看，确保该文件未加密。 OBS桶和Notebook不在同一个区域。请确保读取的OBS桶和Notebook处于同一站点区域，不支持跨站点访问OBS桶。例如：都在华北-北京四站点。具体操作请参见如何查看O

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发 > 上传文件至JupyterLab
数据导入方式介绍 - AI开发平台ModelArts

从DWS导入数据到ModelArts数据集从本地上传数据到ModelArts数据集文件型数据来源文件型数据集支持从两种数据源导入数据：“OBS”和“本地上传”。导入后，导入目录下的数据会复制至数据集的数据源路径下。 OBS：又分为从OBS目录或从Manifest文件两种导入方式，需要将

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集
分离部署推理服务 - AI开发平台ModelArts

"software|firmware" #查看驱动和固件版本如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。驱动版本要求是23.0.6。如果不符合要求请参考安装固件和驱动章节升级驱动。检查docker是否安装。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
训练的数据集预处理说明 - AI开发平台ModelArts

行循环处理其中的单轮对话在单轮对话中对user和assistant的文本进行清洗分别encode处理后的文本，获得对应的token序列，user_ids和assistant_ids input_ids是user_ids和assistant_ids的拼接 labels与in

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909） > 训练脚本说明
在Workflow中更新已部署的服务 - AI开发平台ModelArts

基于编写工作流代码示例的场景案例进行改造，代码编写示例如下： from modelarts import workflow as wf # 定义统一存储对象管理输出目录 output_storage = wf.data.OutputStorage(name="output_storage", de

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
基于ModelArts Standard运行GPU训练任务 - AI开发平台ModelArts

在ModelArts Standard上运行GPU多机多卡训练任务在ModelArts Standard使用run.sh脚本实现OBS和训练容器间的数据传输父主题： Standard模型训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练
Cluster资源池节点故障如何定位 - AI开发平台ModelArts

通过nvidia-smi -a查询到Retired Pages中，Single Bit和Double Bit之和大于64。发起维修流程。 NT_GPU_CARD_LOSE GPU 掉卡 GPU卡丢失。节点规格的GPU卡数和以下任意值不相等： lspci可见GPU卡数。 nvidia-smi可见卡数。

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

无法执行相关GPU命令，只能尝试释放D+进程。处理方法 “nvidia-smi”是一个NVIDIA GPU监视器命令行工具，用于查看GPU的使用情况和性能指标，可以帮助用户进行GPU优化和故障排除。但是建议在业务软件或训练算法中，避免频繁使用“nvidia-smi”命令功能获取相关信息，存在锁死的风险。出现D+进程后可以尝试如下方法：

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

cli是 Hugging Face 官方提供的命令行工具，自带完善的下载功能。具体步骤可参考：HF-Mirror中的使用教程。完成依赖安装和环境变量配置后，以Llama2-70B为例： huggingface-cli download --resume-download meta

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909） > 准备工作
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

cli是 Hugging Face 官方提供的命令行工具，自带完善的下载功能。具体步骤可参考：HF-Mirror中的使用教程。完成依赖安装和环境变量配置后，以Llama2-70B为例： huggingface-cli download --resume-download meta

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908） > 准备工作

总条数： 1676

上一页
1
...
78
79
80
...
84
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

通过JupyterLab在线使用Notebook实例进行AI开发 - AI开发平台ModelArts

主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908） - AI开发平台ModelArts

主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

线下容器镜像构建及调试 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） - AI开发平台ModelArts

创建图像分类数据集并进行标注任务 - AI开发平台ModelArts

上传OBS文件到JupyterLab - AI开发平台ModelArts

数据导入方式介绍 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

在Workflow中更新已部署的服务 - AI开发平台ModelArts

基于ModelArts Standard运行GPU训练任务 - AI开发平台ModelArts

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线