搜索_华为云

准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

修复。代码上传至OBS 将AscendSpeed代码包AscendCloud-3rdLLM-905-xxx.zip在本地解压缩后，将llm_train文件上传至OBS中。结合准备数据、准备权重、准备代码，将数据集、原始权重、代码文件都上传至OBS后，OBS桶的目录结构如下。 <bucket_name>

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 准备工作
ModelArts的自定义镜像软件版本匹配有哪些注意事项？ - AI开发平台ModelArts

MLNX_OFED_LINUX-5.4-3.1.0.0。 CUDA版本需要参考专属资源池的GPU驱动版本，自主进行适配，GPU驱动版本可在专属资源池详情页面查看。父主题： Standard镜像相关

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard镜像相关
PyTorch1.0引擎提示“RuntimeError: std:exception” - AI开发平台ModelArts

PyTorch1.0引擎提示“RuntimeError: std:exception” 问题现象在使用PyTorch1.0镜像时，必现如下报错： “RuntimeError: std:exception” 原因分析 PyTorch1.0镜像中的libmkldnn软连接与原生torch的冲突，具体可参看文档。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
在推理生产环境中部署推理服务 - AI开发平台ModelArts

创建AI应用设置创建AI应用的相应参数。此处仅介绍关键参数，设置AI应用的详细参数解释请参见从OBS中选择元模型。根据需要自定义应用的名称和版本。模型来源选择“从对象存储服务（OBS）中选择”，元模型选择转换后模型的存储路径，AI引擎选择“Custom”，引擎包选择准备镜像中上传的推理镜像。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
发布解决方案 - AI开发平台ModelArts

左侧菜单栏选择“解决方案”进入解决方案列表页，单击右上方的“发布”，进入发布解决方案页面。根据界面提示填写解决方案的相关信息，单击下方的“提交”。在解决方案列表页可以查看发布的方案信息。父主题：合作伙伴

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 合作伙伴
Standard Workflow - AI开发平台ModelArts

降低模型训练成本支持数据标注、数据处理、模型开发/训练、模型评估、应用开发、应用评估等步骤自动协调工作流步骤之间的所有依赖项，提供运行记录、监控、持续运行等功能针对工作流开发，Workflow提供流水线需要覆盖的功能以及功能需要的参数描述，供用户使用SDK对步骤以及步骤之间的关系进行定义

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
释放Standard专属资源池和删除网络 - AI开发平台ModelArts

可切换“训练作业”、“推理服务”、“开发环境”页签查看资源池上创建的训练作业、部署的推理服务、创建的Notebook实例。图1 删除资源池释放游离节点如果您的资源中存在游离节点（即没有被纳管到资源池中的节点），您可在“AI专属资源池 > 弹性集群Cluster >节点”下查看此类节点的相关信息。针

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
部署推理服务 - AI开发平台ModelArts

检查pod启动情况，执行下述命令。如果显示“1/1 running”状态代表启动成功。 kubectl get pod -A 图1 启动pod成功执行如下命令查看pod日志，若打印类似下图信息表示服务启动成功。 kubectl logs -f ${pod_name} 参数说明： ${pod_name}：p

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

/bin/bash while true; do nvidia-smi & sleep 1 # 可以根据需要调整间隔时间 done 然后执行查看产生nvidia D+进程 ps -aux | grep -w D+ 结果如下：图1 nvidia D+进程此时可以观察你的训练任务或

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
管理团队和团队成员 - AI开发平台ModelArts

批量删除标注人员管理如果您创建的标注作业，开启了团队标注，“标注人员管理”页面中可查看团队标注作业的标注详情。添加、修改或删除标注成员。登录“数据准备>数据标注”，在“我创建的”页签下可查看所有的标注作业列表。在作业列表的“名称”列，根据标注作业名称找到对应的团队标注作业。（团队标注作业的名称后带有标识。）

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过团队标注方式标注数据
在ModelArts中训练好后的模型如何获取？ - AI开发平台ModelArts

使用自动学习产生的模型只能在ModelArts上部署上线，无法下载至本地使用。使用自定义算法或者订阅算法训练生成的模型，会存储至用户指定的OBS路径中，供用户下载。父主题： Standard模型训练

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
训练中的权重转换说明 - AI开发平台ModelArts

llama2-13b/saved_models/ 目录下查看转换后的权重文件。注意：权重转换完成后，需要将例如saved_models/pretrain_hf中的文件与原始Hugging Face模型中的文件进行对比，查看是否缺少如tokenizers.json、tokenizer_config

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明
训练中的权重转换说明 - AI开发平台ModelArts

aved_models/pretrain_hf/ 目录下查看转换后的权重文件。注意：权重转换完成后，需要将例如saved_models/pretrain_hf中的文件与原始Hugging Face模型中的文件进行对比，查看是否缺少如tokenizers.json、tokenizer_config

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明
基于MindSpore Lite的模型转换 - AI开发平台ModelArts

再放入netron官网中，查看其inputShape。如果netron中没有显示inputShape，可能由于使用了动态shape模型导致，请确保使用的是静态shape模型。静态shape模型文件导出方法请参考模型准备。图1 netron中查看inputShape 精度选择。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配
在ModelArts数据集中添加图片对图片大小有限制吗？ - AI开发平台ModelArts

方法1：使用导入功能。将图片上传至OBS任意目录，通过“从OBS目录导入”方式导入到已有数据集。方法2：使用同步数据源功能。将图片上传到数据集输入目录下（或者其子目录），单击数据集详情页中的“同步数据源”将新增图片导入。需注意的是，同步数据源同时也会将OBS已删除的文件从数据集也删除，请谨慎操作。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据准备
删除训练作业 - AI开发平台ModelArts

job_id 是 String 训练作业的id，可通过创建训练作业生成的训练作业对象查询，如"job_instance.job_id"，或从查询训练作业列表的响应中获得。无成功响应参数。表2 调用训练接口失败响应参数参数类型描述 error_msg String 调用失败时的错误信息，调用成功时无此字段。

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
git插件密码失效如何解决？ - AI开发平台ModelArts

使用token替换原先的密码授权方式，在git clone私有仓库和git push文件时，需要在授权方式框中输入token（见下图）；具体获取token方式请参考查看GitHub中Personal Access Token信息。父主题： JupyterLab插件故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > JupyterLab插件故障
将Notebook的Conda环境迁移到SFS磁盘 - AI开发平台ModelArts

--prefix /home/ma-user/work/envs/user_conda/sfs-new-env python=3.7.10 -y 查看现有的conda虚拟环境，此时可能出现新创建的虚拟环境的名称为空的情况。 # shell conda env list # conda environments:

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard开发环境
训练中的权重转换说明 - AI开发平台ModelArts

aved_models/pretrain_hf/ 目录下查看转换后的权重文件。注意：权重转换完成后，需要将例如saved_models/pretrain_hf中的文件与原始Hugging Face模型中的文件进行对比，查看是否缺少如tokenizers.json、tokenizer_config

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909） > 训练脚本说明
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

将生成的ascend_vllm文件夹从ECS中取出并上传至OBS中。 Step10 通过openssl创建SSL pem证书在ECS中执行如下命令，会在当前目录生成cert.pem和key.pem，并将生成的pem证书上传至OBS。证书用于后续在推理生产环境中部署HTTPS推理服务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905） > 准备工作

总条数： 2129

上一页
1
...
88
89
90
...
107
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备代码 - AI开发平台ModelArts

ModelArts的自定义镜像软件版本匹配有哪些注意事项？ - AI开发平台ModelArts

PyTorch1.0引擎提示“RuntimeError: std:exception” - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

发布解决方案 - AI开发平台ModelArts

Standard Workflow - AI开发平台ModelArts

释放Standard专属资源池和删除网络 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

管理团队和团队成员 - AI开发平台ModelArts

在ModelArts中训练好后的模型如何获取？ - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

基于MindSpore Lite的模型转换 - AI开发平台ModelArts

在ModelArts数据集中添加图片对图片大小有限制吗？ - AI开发平台ModelArts

删除训练作业 - AI开发平台ModelArts

git插件密码失效如何解决？ - AI开发平台ModelArts

将Notebook的Conda环境迁移到SFS磁盘 - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线