搜索_华为云

创建算法 - AI开发平台ModelArts
创建算法 - AI开发平台ModelArts

resource_requirements 否 Array of ResourceRequirement objects 算法资源约束。可不设置。设置后，在算法使用于训练作业时，控制台会过滤可用的公共资源池。 advanced_config 否 AlgorithmAdvancedConfig

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
分布式训练功能介绍 - AI开发平台ModelArts

支持基于预置镜像自定义制作专属开发环境，并保存使用。丰富的教程，帮助用户快速适配分布式训练，使用分布式训练极大减少训练时间。分布式训练调测的能力，可在PyCharm/VSCode/JupyterLab等开发工具中调试分布式训练。约束限制总览页面打开的CodeLab不支持此项功能，但是如果用户在AI Hub中

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
远程连接处于retry状态如何解决？ - AI开发平台ModelArts

-rf /home/ma-user/.vscode-server/bin/ 参数说明： - IdentityFile：本地密钥路径 - User：用户名，例如：ma-user - HostName：IP地址 - Port：端口号 vscode-server相关问题也可以使用上述的解决方法。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code连接开发环境失败常见问题
远程连接处于retry状态如何解决？ - AI开发平台ModelArts

-rf /home/ma-user/.vscode-server/bin/ 参数说明： - IdentityFile：本地密钥路径 - User：用户名，例如：ma-user - HostName：IP地址 - Port：端口号 vscode-server相关问题也可以使用上述的解决方法。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
环境准备 - AI开发平台ModelArts
环境准备 - AI开发平台ModelArts

通过指定对应的运行镜像，可以直接使用预置的、在迁移过程中所需的工具集，且已经适配到最新的版本可以直接使用。开发者可以通过浏览器入口以Notebook方式访问，也可以通过VSCode远程开发的模式直接接入到云上环境中完成迁移开发与调测，最终生成适配昇腾的推理应用。当前支持以下两种迁移环境搭建方式： ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
OBS复制过程中提示“BrokenPipeError: Broken pipe” - AI开发平台ModelArts

如果是client数太多，尤其对于5G以上文件，OBS接口不支持直接调用，需要分多个线程分段复制，目前OBS侧服务端超时时间是30S，可以通过如下设置减少进程数。 # 设置进程数 os.environ['MOX_FILE_LARGE_FILE_TASK_NUM']=1 import moxing as

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

用户/训练系统，将CUDA_VISIBLE_DEVICES传错了，检查CUDA_VISIBLE_DEVICES变量是否正常。用户选择了1/2/4卡这些规格的作业，然后设置了CUDA_VISIBLE_DEVICES=‘1’这种类似固定的卡ID号，与实际选择的卡ID不匹配。处理方法尽量代码里不要去修改CUD

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
VS Code连接开发环境失败故障处理 - AI开发平台ModelArts

required dependencies 使用VSCode-huawei，报错：卸载了‘ms-vscode-remote.remot-sdh’，它被报告存在问题使用VS Code连接实例时，发现VS Code端的实例目录和云上目录不匹配 VSCode远程连接时卡顿，或Python调试插件无法使用如何处理？

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境
在线服务预测时，如何提高预测速度？ - AI开发平台ModelArts

格”提高预测速度。例如使用GPU资源代替CPU资源。部署在线服务时，您可以增加“计算节点个数”。如果节点个数设置为1，表示后台的计算模式是单机模式；如果节点个数设置大于1，表示后台的计算模式为分布式的。您可以根据实际需求进行选择。推理速度与模型复杂度强相关，您可以尝试优化模型提高预测速度。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 在线服务
给子账号配置开发环境基本使用权限 - AI开发平台ModelArts

添加开发环境使用权限和依赖服务SWR权限。在统一身份认证服务页面的左侧导航选择“权限管理 > 权限”，单击右上角的“创建自定义策略”，设置策略。添加开发环境使用权限。 “策略名称”：设置自定义策略名称，例如：notebook。 “策略配置方式”：选择JSON视图。 “策略内容”：填入如下内容。 {

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
Standard开发环境 - AI开发平台ModelArts

将Notebook的Conda环境迁移到SFS磁盘使用ModelArts PyCharm插件调试训练ResNet50图像分类模型使用ModelArts VSCode插件调试训练ResNet50图像分类模型

 帮助中心 > AI开发平台ModelArts > 最佳实践
VS Code连接开发环境失败时的排查方法 - AI开发平台ModelArts

端口有问题，请联系技术支持。端口无问题请继续远端排查。远端排查排查/home/ma-user目录权限是否为755/750，不是该权限，请执行如下命令设置权限。 chmod 755 /home/ma-user 排查/home/ma-user/.ssh目录权限是否为755/750，不是该权限请修改。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code连接开发环境失败常见问题
训练作业访问OBS时，日志提示“stat:403 reason:Forbidden” - AI开发平台ModelArts

码迁移过程中的错误。直接使用线上notebook环境调试请参考使用JupyterLab开发模型。配置本地IDE（Pycharm或者VSCode）联接云上环境调试请参考使用本地IDE开发模型。 OBS服务相关报错可根据错误信息（包括errorCode、errorMessage等

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 权限问题
VS Code连接开发环境失败时的排查方法 - AI开发平台ModelArts

端口有问题，请联系技术支持。端口无问题请继续远端排查。远端排查排查/home/ma-user目录权限是否为755/750，不是该权限，请执行如下命令设置权限。 chmod 755 /home/ma-user 排查/home/ma-user/.ssh目录权限是否为755/750，不是该权限请修改。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
推理精度测试 - AI开发平台ModelArts

确保Notebook内通网，已通网可以跳过这一步，未通网需要配置$config_proxy_str，$config_pip_str设置对应的代理和pip源，来确保当前代理和pip源可用。精度评测新建一个conda环境，确保之前启动服务为vllm接口，进入到benchmark_eval目录

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
推理精度测试 - AI开发平台ModelArts

#构造vllm评测配置脚本名字确保容器内通网，未通网需要配置$config_proxy_str，$config_pip_str设置对应的代理和pip源，来确保当前代理和pip源可用。精度评测新建一个conda环境，确保之前启动服务为vllm接口，进入到benchmark_eval目录

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906）
如何解决“在IOS系统里打开ModelArts的Notebook，字体显示异常”的问题？ - AI开发平台ModelArts

的Notebook，字体显示异常”的问题？问题现象在IOS系统里打开ModelArts的Notebook时，字体显示异常。解决方法设置Terminal的“fontFamily”为“Menlo”。操作步骤登录ModelArts管理控制台，选择“开发空间>Notebook”。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 环境配置相关
在Notebook中，如何使用昇腾多卡进行调试？ - AI开发平台ModelArts

昇腾多卡训练任务是多进程多卡模式，跑几卡需要起几个python进程。昇腾底层会读取环境变量：RANK_TABLE_FILE，开发环境已经设置，用户无需关注。比如跑八卡，可以如下片段代码： export RANK_SIZE=8 current_exec_path=$(pwd)

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
如何解决训练过程中出现的cudaCheckError错误？ - AI开发平台ModelArts

device 原因分析因为编译的时候需要设置setup.py中编译的参数arch和code和电脑的显卡匹配。解决方法对于GP Vnt1的显卡，GPU算力为-gencode arch=compute_70,code=[sm_70,compute_70]，设置setup.py中的编译参数即可解决。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 代码运行常见错误
如何解决训练过程中出现的cudaCheckError错误？ - AI开发平台ModelArts

device 原因分析因为编译的时候需要设置setup.py中编译的参数arch和code和电脑的显卡匹配。解决方法对于GP Vnt1的显卡，GPU算力为-gencode arch=compute_70,code=[sm_70,compute_70]，设置setup.py中的编译参数即可解决。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障

总条数： 838

上一页
1
2
3
4
5
...
42
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建算法 - AI开发平台ModelArts

分布式训练功能介绍 - AI开发平台ModelArts

远程连接处于retry状态如何解决？ - AI开发平台ModelArts

远程连接处于retry状态如何解决？ - AI开发平台ModelArts

环境准备 - AI开发平台ModelArts

OBS复制过程中提示“BrokenPipeError: Broken pipe” - AI开发平台ModelArts

日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

VS Code连接开发环境失败故障处理 - AI开发平台ModelArts

在线服务预测时，如何提高预测速度？ - AI开发平台ModelArts

给子账号配置开发环境基本使用权限 - AI开发平台ModelArts

Standard开发环境 - AI开发平台ModelArts

VS Code连接开发环境失败时的排查方法 - AI开发平台ModelArts

训练作业访问OBS时，日志提示“stat:403 reason:Forbidden” - AI开发平台ModelArts

VS Code连接开发环境失败时的排查方法 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

如何解决“在IOS系统里打开ModelArts的Notebook，字体显示异常”的问题？ - AI开发平台ModelArts

在Notebook中，如何使用昇腾多卡进行调试？ - AI开发平台ModelArts

如何解决训练过程中出现的cudaCheckError错误？ - AI开发平台ModelArts

如何解决训练过程中出现的cudaCheckError错误？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线