搜索_华为云

创建数据集版本 - AI开发平台ModelArts

version_format=None, label_task_type=None, label_task_id=None, **kwargs) 示例代码示例一：为数据集创建新的版本 from modelarts.session import Session from modelarts.dataset

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 数据集版本管理
文件传输（推荐） - AI开发平台ModelArts

文件传输（推荐）该接口支持上传本地文件和文件夹至OBS，支持下载OBS文件和文件夹至本地，推荐使用该接口。示例代码在ModelArts Notebook平台，Session鉴权无需输入鉴权参数。其它平台的Session鉴权请参见Session鉴权。 from modelarts

帮助中心 > AI开发平台ModelArts > SDK参考 > OBS管理
部署推理服务 - AI开发平台ModelArts

b46-c46bk。图2 启动服务成功 Step5 推理请求执行如下命令进入容器。 kubectl exec -it {pod_name} bash 参数说明： ${pod_name}：pod名，例如图1${pod_name}为yourapp-87d9b5b46-c46bk。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
报错“An SSH installation couldn't be found”或者“Could not establish connection to instance xxx: 'ssh' ...”如何解决？ - AI开发平台ModelArts

当通过“可选功能”未能成功安装时，请手动下载OpenSSH安装包，然后执行以下步骤：下载zip包并解压放入“C:\Windows\System32”。以管理员身份打开CMD，在“C:\Windows\System32\OpenSSH-xx”目录下，执行以下命令： powershell

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
报错“An SSH installation couldn't be found”或者“Could not establish connection to instance xxx: 'ssh' ...”如何解决？ - AI开发平台ModelArts

当通过“可选功能”未能成功安装时，请手动下载OpenSSH安装包，然后执行以下步骤：下载zip包并解压放入“C:\Windows\System32”。以管理员身份打开CMD，在“C:\Windows\System32\OpenSSH-xx”目录下，执行以下命令： powershell

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code连接开发环境失败常见问题
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

桶。准备数据准备训练数据，可以用本案使用的数据集，也可以使用自己准备的数据集。准备权重准备所需的权重文件。准备代码准备AscendSpeed训练代码。准备镜像准备训练模型适用的容器镜像。准备Notebook 本案例需要创建一个Notebook，以便能够通过它访问SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907）
【下线公告】华为云ModelArts服务旧版训练管理下线公告 - AI开发平台ModelArts

旧版训练迁移至新版训练需要注意哪些问题？新版训练和旧版训练的差异主要体现在以下3点，详细内容请参见旧版训练迁移至新版训练注意事项。新旧版创建训练作业方式差异新旧版训练代码适配的差异新旧版训练预置引擎差异父主题：下线公告

 帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
训练作业卡死检测定位 - AI开发平台ModelArts

率的方差和中位数来判断资源使用率是否有变化。如果没有变化，则判定作业卡死。由于检测规则的局限性，当前卡死检测存在一定的误检率。如果是作业代码本身逻辑（如长时间sleep）导致的卡死，请忽略。如果对于误检有疑问或者卡死问题无法自行解决，您可以前往ModelArts开发者论坛进行提问或者搜索问题。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业卡死
设置无条件自动重启 - AI开发平台ModelArts

率和提升作业的稳定性。为了避免无效重启浪费算力资源，系统最多只支持连续无条件重启3次。为了避免丢失训练进度、浪费算力，开启此功能前请确认代码已适配断点续训，操作指导请参见设置断点续训练。当训练过程中触发了自动重启，则系统会记录重启信息，在训练作业详情页可以查看故障恢复详情，具体请参见训练作业重调度。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
创建和保存Manifest文件 - AI开发平台ModelArts

需要Session信息。 manifest_info.save(path, session=None, save_mode="w") 示例代码在保存Manifest文件之前需要先创建包含Manifest信息的对象，包括Sample样本信息及其标签信息Annotation，然后将

 帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > Manifest管理
查询训练日志 - AI开发平台ModelArts

查询训练日志示例代码在ModelArts notebook平台，Session鉴权无需输入鉴权参数。其它平台的Session鉴权请参见Session鉴权。方式一：根据指定的job_id查询。 from modelarts.session import Session from

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
训练场景和方案介绍 - AI开发平台ModelArts

推荐使用“西南-贵阳一”Region上的DevServer资源和Ascend Snt9B。软件配套版本表1 获取软件分类名称获取路径插件代码包 AscendCloud-6.3.908软件包中的AscendCloud-AIGC-6.3.908-xxx.zip 文件名中的xxx表示

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
在推理生产环境中部署推理服务 - AI开发平台ModelArts

”，输入预测代码“{"prompt": "你好", "temperature":0, "max_tokens":20}”，单击“预测”既可看到预测结果。图4 预测-vllm 若以openai接口启动服务，设置请求路径：“/v1/completions”，输入预测代码“{"prompt":

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
在推理生产环境中部署推理服务 - AI开发平台ModelArts

”，输入预测代码“{"prompt": "你好", "temperature":0, "max_tokens":20}”，单击“预测”既可看到预测结果。图4 预测-vllm 若以openai接口启动服务，设置请求路径：“/v1/completions”，输入预测代码“{"prompt":

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
VS Code连接开发环境失败常见问题 - AI开发平台ModelArts

报错“Permissions for 'x:/xxx.pem' are too open”如何解决？报错“Bad owner or permissions on C:\Users\Administrator/.ssh/config”或“Connection permission denied (publickey)”如何解决？

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

rk_dir} 代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的文件系统。work_dir为宿主机中工作目录，目录下存放着训练所需代码、数据等文件。container_work_dir为要挂载到的容器中的目录。为方便两个地址可以相同。容器不能挂载/home/ma-use

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905） > 准备工作
GPU A系列裸金属服务器无法获取显卡如何解决 - AI开发平台ModelArts

not yet initialized (Triggered internally at ../c10/cuda/CUDAFunctions.cpp:109.) return torch._C._cuda_getDeviceCount() > 0 False 原因分析 Error

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
附录：指令微调训练常见问题 - AI开发平台ModelArts

flash_attn 根因：昇腾环境暂时不支持flash_attn接口规避措施：修改dynamic_module_utils.py文件，将180-184行代码注释掉 vim /home/ma-user/anaconda3/envs/PyTorch-2.1.0/lib/python3.9/site

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907）
训练场景和方案介绍 - AI开发平台ModelArts

推荐使用“西南-贵阳一”Region上的DevServer资源和Ascend Snt9B。软件配套版本表1 获取软件分类名称获取路径插件代码包 AscendCloud-6.3.908软件包中的AscendCloud-AIGC-6.3.908-xxx.zip 文件名中的xxx表示

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD1.5&SDXL Koyha框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
如何使用API接口获取订阅算法的订阅id和版本id？ - AI开发平台ModelArts

=5&sort_dir=desc 获取订阅算法的subscription_id，假设为43b22aeb-5b28-4fad-9581-e3c16d5a3e68，该值即为算法的订阅id。根据subscription_id获取订阅算法的版本列表 GET https://modelarts

帮助中心 > AI开发平台ModelArts > 常见问题 > API/SDK

总条数： 1232

上一页
1
...
54
55
56
...
62
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建数据集版本 - AI开发平台ModelArts

文件传输（推荐） - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

报错“An SSH installation couldn't be found”或者“Could not establish connection to instance xxx: 'ssh' ...”如何解决？ - AI开发平台ModelArts

报错“An SSH installation couldn't be found”或者“Could not establish connection to instance xxx: 'ssh' ...”如何解决？ - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

【下线公告】华为云ModelArts服务旧版训练管理下线公告 - AI开发平台ModelArts

训练作业卡死检测定位 - AI开发平台ModelArts

设置无条件自动重启 - AI开发平台ModelArts

创建和保存Manifest文件 - AI开发平台ModelArts

查询训练日志 - AI开发平台ModelArts

训练场景和方案介绍 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

VS Code连接开发环境失败常见问题 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

GPU A系列裸金属服务器无法获取显卡如何解决 - AI开发平台ModelArts

附录：指令微调训练常见问题 - AI开发平台ModelArts

训练场景和方案介绍 - AI开发平台ModelArts

如何使用API接口获取订阅算法的订阅id和版本id？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线