搜索_华为云

训练模型时引用依赖包，如何创建训练作业？ - AI开发平台ModelArts

训练模型时引用依赖包，如何创建训练作业？ ModelArts支持训练模型过程中安装第三方依赖包。在训练代码目录下放置“pip-requirements.txt”文件后，在训练启动文件被执行前系统会执行如下命令，以安装用户指定的Python Packages。 pip install

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 编写训练代码
SDXL基于Standard适配PyTorch NPU的LoRA训练指导（6.3.908） - AI开发平台ModelArts

训练作业使用单机单卡资源。确保容器可以访问公网。本案例仅支持在专属资源池上运行。 Step1 创建专属资源池本文档中的模型运行环境是ModelArts Standard，用户需要购买专属资源池，具体步骤请参考创建资源池。资源规格要求：硬盘空间：至少200GB。昇腾资源规格：Ascend:

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
准备Notebook - AI开发平台ModelArts

创建Notebook 创建Notebook时，选择自定义镜像，并选择Step8 注册镜像章中注册的镜像。图2 选择自定义镜像资源类型推荐使用专属资源池，规格选到Ascend snt9b，显存规格建议选择64G以上的规格，磁盘规格建议选择500GB及以上。创建完Noteboo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 准备工作
准备Notebook - AI开发平台ModelArts

创建Notebook 创建Notebook时，选择自定义镜像，并选择Step8 注册镜像章中注册的镜像。图2 选择自定义镜像资源类型推荐使用专属资源池，规格选到Asecnd snt9b，显存规格建议选择64G以上的规格，磁盘规格建议选择500GB及以上。创建完Noteboo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） > 准备工作
准备Notebook - AI开发平台ModelArts

此处仅介绍关键步骤。创建Notebook时，选择自定义镜像，并选择Step8 注册镜像章中注册的镜像。图1 选择自定义镜像资源类型推荐使用专属资源池，规格选到Ascend snt9b，显存规格建议选择64G以上的规格，磁盘规格建议选择500GB及以上。创建完Noteboo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905） > 准备工作
MaaS大模型即服务平台功能介绍 - AI开发平台ModelArts

保障客户系统应用大模型的成本效率，按需收费，按需扩缩的灵活成本效益资源配置方案，有效避免了资源闲置与浪费，降低了进入AI领域的门槛。架构强调高可用性，多数据中心部署确保数据与任务备份，即使遭遇故障，也能无缝切换至备用系统，维持模型训练不中断，保护长期项目免受时间与资源损耗，确保进展与收益。大模型应用开发，帮助开发者快速构建智能Agents

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

conversation_id为空的个数) proportion 和 test_count 二选一即可，如果同时输入，则优先使用 test_count，如果都未输入，则返回处理失败 False。上传数据集至SFS Turbo 准备数据集，例如根据Alpaca数据部分给出的预训练数据集、SFT全参微调训练、LoRA微

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909） > 准备工作
查询预置算法 - AI开发平台ModelArts

is_success Boolean 请求是否成功。 error_message String 调用失败时的错误信息。调用成功时无此字段。 error_code String 调用失败时的错误码，具体请参见错误码。调用成功时无此字段。 model_total_count Integer

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

表示流水线并行中一个micro batch所处理的样本量。在流水线并行中，为了减少气泡时间，会将一个step的数据切分成多个micro batch。该值与TP和PP以及模型大小相关，可根据实际情况进行调整。 GBS 512 表示训练中所有机器一个step所处理的样本量。影响每一次训练迭代的时长。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908）
LoRA微调训练 - AI开发平台ModelArts

表示流水线并行中一个micro batch所处理的样本量。在流水线并行中，为了减少气泡时间，会将一个step的数据切分成多个micro batch。该值与TP和PP以及模型大小相关，可根据实际情况进行调整。 GBS 512 表示训练中所有机器一个step所处理的样本量。影响每一次训练迭代的时长。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908）
更新API授权 - AI开发平台ModelArts

app_id String APP的编号，可通过查询APP列表获取。 auth_id String 授权编号，授权失败时为空。 reason String 授权或者取消授权失败原因，授权成功时为空。 success Boolean 授权或者取消授权是否成功。状态码： 401 表8 响应Header参数

 帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
在推理生产环境中部署推理服务 - AI开发平台ModelArts

在推理生产环境中部署推理服务本章节介绍如何在ModelArts的推理生产环境（ModelArts控制台的在线服务功能）中部署推理服务。 Step1 准备模型文件和权重文件在OBS桶中，创建文件夹，准备ascend_vllm代码包、模型权重文件、推理启动脚本run_vllm.s

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
迁移评估 - AI开发平台ModelArts
迁移评估 - AI开发平台ModelArts

通用的推理业务及LLM推理业务迁移评估表收集项说明实际情况（请填写）项目名称项目名称，例如：XXX项目。 - 使用场景例如：使用YOLOv5算法对工地的视频流裁帧后进行安全帽检测。使用BertBase算法对用户在app上购买商品后的评论进行理解。 - CPU架构 X86/ARM，自有软件是否支持ARM。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
解除API对APP的授权 - AI开发平台ModelArts

app_id String APP的编号，可通过查询APP列表获取。 auth_id String 授权编号，授权失败时为空。 reason String 授权或者取消授权失败原因，授权成功时为空。 success Boolean 授权或者取消授权是否成功。状态码： 401 表9 响应Header参数

 帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
在ModelArts创建分布式训练时如何设置NCCL环境变量？ - AI开发平台ModelArts

大的值可能会影响性能，设置为18相对平衡。 NCCL_IB_RETRY_CNT 15 IB通信重试次数。建议设置为最大值15，减少IB通信失败的概率。父主题：创建训练作业

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 创建训练作业
删除开发环境实例 - AI开发平台ModelArts

成功响应示例 { "instance_id": "6fa459ea-ee8a-3ca4-894e-db77e160355e" } 失败响应示例 { "error_message": "The instance does not exist.", "error_code":

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
管理AI Gallery模型 - AI开发平台ModelArts

Gallery工具链服务。硬件资源选择支持运行该模型的硬件类型。最低可运行规格设置能够运行该模型的最低计算规格。在AI Gallery工具链服务中使用该模型时，只能选取等同或高于该规格的算力资源进行任务下发。是否支持分布式训练/推理选择该模型资产是否支持在单机多卡的资源节点上进行并行训练或推理。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型
准备预测分析数据 - AI开发平台ModelArts

输入数据的OBS路径应指向数据文件，且文件不能直接放在OBS桶的根目录下，应该存放在OBS桶的文件夹内。如：“/obs-xxx/data/input.csv”。输入数据的格式必须为csv格式，有效数据行数必须大于100行。列数必须小于200列，数据总大小不能超过100MB。上传OBS操作步骤：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现预测分析
依赖和委托 - AI开发平台ModelArts

dws:cluster:list 可选配置，如果访问DWS数据需要配置。表15 专属资源池管理基础委托授权业务场景依赖的服务委托授权项说明通过关联sfsturbo功能实现专属资源池和SFS Turbo资源打通。 SFS Turbo sfsturbo:shares:showShareNic

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
昇腾迁移快速入门案例 - AI开发平台ModelArts

0-cann_7.0.1-py_3.9-euler_2.10.7-aarch64-snt9b”。类型选择“ASCEND”。实例规格选择snt9b资源。存储配置选择“云硬盘EVS”。磁盘规格按照对应的存储使用情况选择存储大小。 SSH远程开发如果需通过VS Code远程连接No

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导

总条数： 1561

上一页
1
...
61
62
63
...
79
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练模型时引用依赖包，如何创建训练作业？ - AI开发平台ModelArts

SDXL基于Standard适配PyTorch NPU的LoRA训练指导（6.3.908） - AI开发平台ModelArts

准备Notebook - AI开发平台ModelArts

准备Notebook - AI开发平台ModelArts

准备Notebook - AI开发平台ModelArts

MaaS大模型即服务平台功能介绍 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

查询预置算法 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

更新API授权 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

迁移评估 - AI开发平台ModelArts

解除API对APP的授权 - AI开发平台ModelArts

在ModelArts创建分布式训练时如何设置NCCL环境变量？ - AI开发平台ModelArts

删除开发环境实例 - AI开发平台ModelArts

管理AI Gallery模型 - AI开发平台ModelArts

准备预测分析数据 - AI开发平台ModelArts

依赖和委托 - AI开发平台ModelArts

昇腾迁移快速入门案例 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线