搜索_华为云

使用PyCharm手动连接Notebook - AI开发平台ModelArts

执行如下命令可在/home/ma-user/下面的README文件查看当前环境内置的Python虚拟环境。 cat /home/ma-user/README 执行source命令可以切换到具体的Python环境中。执行which python查看python路径并复制出来，以备后续配置云上Python

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过PyCharm远程使用Notebook实例
ModelArts Standard使用流程 - AI开发平台ModelArts

部署为在线服务部署为批量服务访问服务服务部署完成后，针对在线服务和边缘服务，您可以访问并使用服务，针对批量服务，您可以查看其预测结果。访问在线服务查看批量服务预测结果

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

介绍如何进行预训练，包括训练数据处理、超参配置、创建训练任务及性能查看。微调训练 SFT全参微调介绍如何进行SFT全参微调，包括训练数据处理、超参配置、创建训练任务及性能查看。 LoRA微调训练介绍如何进行LoRA微调训练，包括训练数据处理、超参配置、创建训练任务及性能查看。父主题：主流开源大模型基于S

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908）
Lite Server资源配置流程 - AI开发平台ModelArts

解决方案。 3 配置Lite Server软件环境不同镜像中预安装的软件不同，您通过Lite Server算力资源和镜像版本配套关系章节查看已安装的软件。当Server服务器中预装的软件无法满足业务需求时，您可在Server服务器中配置所需要的软件环境。父主题： Lite Server资源配置

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
重装的包与镜像装CUDA版本不匹配 - AI开发平台ModelArts

新安装的包与镜像中带的CUDA版本不匹配。处理方法必现的问题，使用本地Pycharm远程连接Notebook调试安装。先远程登录到所选的镜像，使用“nvcc -V”查看目前镜像自带的CUDA版本。重装torch等，需要注意选择与上一步版本相匹配的版本。建议与总结在创建训练作业前，推荐您先使用Mode

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
昇腾云服务6.3.905版本说明 - AI开发平台ModelArts

905-20240611214128.zip 三方大模型训练和推理代码包获取路径：Support-E 说明：如果上述软件获取路径打开后未显示相应的软件信息，说明您没有下载权限，请联系您所在企业的华为方技术支持下载获取。 AscendCloud-3rdAIGC-6.3.905-20240529154412

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
VS Code连接开发环境失败时，请先进行基础问题排查 - AI开发平台ModelArts

StrictHostKeyChecking no UserKnownHostsFile /dev/null ForwardAgent yes 查看密钥文件，建议放在C:\Users\xx.ssh下，并确保密钥文件无中文字符。如果还未解决，请参考后续章节处理。父主题： VS Code连接开发环境失败故障处理

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
为什么资源充足还是在排队？ - AI开发平台ModelArts

业或实例上，判断是否使用了专属资源池。如判断相关作业或实例可停止，则可以停止，释放出更多的资源。图1 总览单击进入专属资源池详情页面，查看作业列表。观察队头是否有其他作业在排队，如果已有作业在排队，则新建的作业需要继续等待。图2 作业排队列表如果通过排查计算，发现资源确

 帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
限制用户使用公共资源池 - AI开发平台ModelArts

在统一身份认证服务页面的左侧导航选择“用户组”，在用户组页面查找待授权的用户组名称，在右侧的操作列单击“授权”，勾选步骤2创建的两条自定义策略，单击“下一步”，选择授权范围方案，单击“确定”。此时，该用户组下的所有用户均有权限查看该用户组内成员创建的所有Notebook实例。如果没

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

包含了本教程中使用到的模型训练代码。代码包具体说明请参见模型软件包结构说明。获取路径：Support-E 说明：如果上述软件获取路径打开后未显示相应的软件信息，说明您没有下载权限，请联系您所在企业的华为方技术支持下载获取。模型软件包结构说明 AscendCloud-6.3.907代码包中Asc

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 准备工作
在推理生产环境中部署推理服务 - AI开发平台ModelArts

关闭Matmul_all_reduce融合算子的命令： unset USE_MM_ALL_REDUCE_OP 配置后重启推理服务生效。查看详细日志查看详细耗时日志可以辅助定位性能瓶颈，但会影响推理性能。如需开启，配置以下环境变量。 export DETAIL_TIME_LOG=1 export

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
什么是Workflow - AI开发平台ModelArts

权限，并查看相应的资源使用情况等。时间安排：围绕子流水线配置相应的子任务安排，并加以通知机制，实现流程执行过程之间配合的运转高效管理。流程质量与效率测评：提供流水线的任务执行过程视图，增加不同的检查点，如数据评估、模型评估、性能评估等，让AI项目管理者能很方便的查看流水线执行过程的质量与效率。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

配的情况。如果上述方法还出现了错误，可以去notebook里面调试打印CUDA_VISIBLE_DEVICES变量，或者用以下代码测试，查看结果是否返回的是True。 import torch torch.cuda.is_available() 建议与总结在创建训练作业前，推

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
训练中的权重转换说明 - AI开发平台ModelArts

/home/ma-user/ws/processed_for_ma_input/llama2-13b/converted_weights_TP${TP}PP${PP} 目录下查看转换后的权重文件。 Megatron转HuggingFace参数说明训练完成的权重文件默认不会自动转换为Hugging Face格式权重

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
VS Code连接开发环境失败时，请先进行基础问题排查 - AI开发平台ModelArts

StrictHostKeyChecking no UserKnownHostsFile /dev/null ForwardAgent yes 查看密钥文件，建议放在C:\Users\xx.ssh下，并确保密钥文件无中文字符。如果还未解决，请参考后续章节的FAQ处理。父主题： VS

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code连接开发环境失败常见问题
使用Cloud Shell调试生产训练作业 - AI开发平台ModelArts

） pip install py-spy 查看堆栈。py-spy工具的具体使用方法可参考py-spy官方文档。 # 找到训练进程的PID ps -ef # 查看进程12345的进程堆栈 # 如果是8卡的训练作业，一般用此命令依次去查看主进程起的对应的8个进程的堆栈情况 py-spy

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
SFT全参微调训练任务 - AI开发平台ModelArts

<NODE_RANK=0> sh scripts/llama2/0_pl_sft_13b.sh localhost 1 0 训练完成后，请参考查看日志和性能章节查看SFT微调的日志和性能。父主题：主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905）
身份认证与访问控制 - AI开发平台ModelArts

身份认证与访问控制身份认证用户访问ModelArts的方式有多种，包括ModelArts控制台、API、SDK，无论访问方式封装成何种形式，其本质都是通过ModelArts提供的REST风格的API接口进行请求。 ModelArts的接口均需要进行认证鉴权以此来判断是否通过身

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
训练的权重转换说明 - AI开发平台ModelArts

processed_for_ma_input/llama2-13b/converted_weights_TP${TP}PP${PP}目录下查看转换后的权重文件。 Megatron转HuggingFace参数说明训练完成的权重文件默认不会自动转换为Hugging Face格式权重

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
LoRA微调训练 - AI开发平台ModelArts

<NODE_RANK=0> sh scripts/llama2/0_pl_lora_13b.sh localhost 1 0 训练完成后，请参考查看日志和性能章节查看LoRA微调训练的日志和性能。父主题：主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905）

总条数： 1302

上一页
1
...
59
60
61
...
66
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用PyCharm手动连接Notebook - AI开发平台ModelArts

ModelArts Standard使用流程 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

Lite Server资源配置流程 - AI开发平台ModelArts

重装的包与镜像装CUDA版本不匹配 - AI开发平台ModelArts

昇腾云服务6.3.905版本说明 - AI开发平台ModelArts

VS Code连接开发环境失败时，请先进行基础问题排查 - AI开发平台ModelArts

为什么资源充足还是在排队？ - AI开发平台ModelArts

限制用户使用公共资源池 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

什么是Workflow - AI开发平台ModelArts

日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

VS Code连接开发环境失败时，请先进行基础问题排查 - AI开发平台ModelArts

使用Cloud Shell调试生产训练作业 - AI开发平台ModelArts

SFT全参微调训练任务 - AI开发平台ModelArts

身份认证与访问控制 - AI开发平台ModelArts

训练的权重转换说明 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线