搜索_华为云

精度校验 - AI开发平台ModelArts
精度校验 - AI开发平台ModelArts

用benchmark进行精度比对的基本流程如下：将模型输入保存二进制文件。 # 数据读取，预处理 image = img_preprocess(image_path) image = np.array(image, dtype=np.float32) image = np.frombuffer(image

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
SFT全参微调训练 - AI开发平台ModelArts

TP×PP×CP)的值进行整除。 Step4 开启训练故障自动重启功能创建训练作业时，可开启自动重启功能。当环境问题导致训练作业异常时，系统将自动修复异常或隔离节点，并重启训练作业，提高训练成功率。为了避免丢失训练进度、浪费算力。此功能已适配断点续训练。图3 开启故障重启断

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911）
查看训练作业事件 - AI开发平台ModelArts

查看训练作业事件训练作业的（从用户可看见训练作业开始）整个生命周期中，每一个关键事件点在系统后台均有记录，用户可随时在对应训练作业的详情页面进行查看。方便用户更清楚的了解训练作业运行过程，遇到任务异常时，更加准确的排查定位问题。当前支持的作业事件如下所示：训练作业创建成功训练作业创建失败报错：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
LoRA微调训练 - AI开发平台ModelArts

TP×PP×CP)的值进行整除。 Step4 开启训练故障自动重启功能创建训练作业时，可开启自动重启功能。当环境问题导致训练作业异常时，系统将自动修复异常或隔离节点，并重启训练作业，提高训练成功率。为了避免丢失训练进度、浪费算力。此功能已适配断点续训练。图2 开启故障重启断

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.909）
LoRA微调训练 - AI开发平台ModelArts

TP×PP×CP)的值进行整除。 Step4 开启训练故障自动重启功能创建训练作业时，可开启自动重启功能。当环境问题导致训练作业异常时，系统将自动修复异常或隔离节点，并重启训练作业，提高训练成功率。为了避免丢失训练进度、浪费算力。此功能已适配断点续训练。图2 开启故障重启断

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.910）
查询数据集导入任务列表 - AI开发平台ModelArts

已导入的样本数量。 imported_sub_sample_count Long 已导入的子样本数量。 processor_task_id String 预处理任务ID。 processor_task_status Integer 预处理任务状态。 status String 导入任务的当前状态。可选值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
ascendfactory-cli方式启动（推荐） - AI开发平台ModelArts

<cfgs_yaml_file> <model_name> <exp_name> # 指定设备卡数，如2卡 ASCEND_RT_VISIBLE_DEVICES=0,1 ascendfactory-cli train <cfgs_yaml_file> <model_name> <exp_name>

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 执行训练任务
给子账号配置文件夹级的SFS Turbo访问权限 - AI开发平台ModelArts

在已有的ModelArts委托权限中，追加IAM ReadOnlyAccess权限。在ModelArts管理控制台，单击“权限管理 ”，在对应委托的操作列，单击“查看权限 > 去IAM修改委托权限”。在新页面中，单击“授权记录 > 授权”，搜索“IAM ReadOnlyAccess”，勾选后单击“下一步”并单击“确认”。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
使用moxing适配OBS路径，pandas读取文件报错 - AI开发平台ModelArts

码。 import pandas as pd import moxing as mox mox.file.shift('os', 'mox') # 将os的open操作替换为mox.file.File适配OBS路径的操作 param = {'encoding': 'utf-8'}

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
查询训练作业指定任务的日志（OBS链接） - AI开发平台ModelArts

26f3be8c68-ma-platform-init-worker-0-172.16.24.51-01909681.log?AWSAccessKeyId=xxxxx" } 状态码状态码描述 200 ok 错误码请参见错误码。父主题：训练管理

 帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
扩缩容Standard专属资源池 - AI开发平台ModelArts

Size不一致，可能会使得部分任务在不同节点的运行情况不一致，请谨慎操作。存量节点不支持修改容器引擎空间大小。修改操作系统。在“操作系统”下拉列表中指定操作系统版本。指定节点计费模式。用户增加节点数量时，可以打开“节点计费模式”开关，为资源池新扩容的节点设置不同于资源池的计费

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
训练专属预置镜像列表 - AI开发平台ModelArts

04-x86_64-roma-20220309171256-40adcc1 镜像构建时间：20220309171256 (yyyy-mm-dd-hh-mm-ss) 镜像系统版本：Ubuntu 18.04.4 LTS cuda：10.2.89 cudnn：7.6.5.32 Python解释器路径及版本：/hom

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > ModelArts支持的预置镜像列表
从DLI导入数据到ModelArts数据集 - AI开发平台ModelArts

和类型)需与数据集一致，支持自动获取所选择表的schema。DLI的详细功能说明，请参考DLI用户指南。图1 DLI导入数据队列名称：系统自动将当前账号下的DLI队列展现在列表中，用户可以在下拉框中选择需要的队列。数据库名称：根据选择的队列展现所有的数据库，请在下拉框中选择您所需的数据库。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集
执行训练任务（推荐） - AI开发平台ModelArts

数据集选择:dataset和processed_data_dir参数二选一，详解如下：参数示例值参数说明 dataset 【预训练：pt】预训练数据集相对或绝对地址【微调：sft】微调数据集相对或绝对地址训练时指定的输入数据路径。请根据实际规划修改。用户根据训练情况二选一； processed_data_dir

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
训练作业使用MoXing复制数据较慢，重复打印日志 - AI开发平台ModelArts

上，这样会导致下载数据很慢。在训练作业中，使用如下代码进行“.tar”包解压： import moxing as mox import os mox.file.copy_parallel("obs://donotdel-modelarts-test/AI/data/PyTorch-1

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
SDXL基于Lite Server适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

attention_processor.py /home/ma-user/anaconda3/envs/PyTorch-2.1.0/lib/python3.9/site-packages/diffusers/models/attention_processor.py 构建自定义镜像sdxl-train:0

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
扩缩容Lite Cluster资源池 - AI开发平台ModelArts

27，仅支持选择Containerd作为容器引擎。其余CCE集群版本，支持选择Containerd或Docker作为容器引擎。修改操作系统。在“操作系统”下拉列表中指定操作系统版本。修改驱动版本。在“驱动版本”下拉列表中指定驱动版本。指定节点计费模式。用户增加节点数量时，可以打开“节点计费

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
管理Notebook实例 - AI开发平台ModelArts

查找Notebook实例更新Notebook实例启动/停止/删除实例保存Notebook实例动态扩充云硬盘EVS容量动态挂载OBS并行文件系统查看Notebook实例事件 Notebook Cache盘告警上报父主题：使用Notebook进行AI开发调试

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
什么是Workflow - AI开发平台ModelArts

LOps打通了算法开发到交付运维的全流程。和以往的开发交付不同，以往的开发与交付过程是分离的，算法工程师开发完的模型，一般都需要交付给下游系统工程师。MLOps和以往的开发交付不同，在这个过程中，算法工程师参与度还是非常高的。企业内部一般都是有一个交付配合的机制。从项目管理角度上

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
使用AWQ量化工具转换权重 - AI开发平台ModelArts

运行“examples/quantize.py”文件进行模型量化，量化时间和模型大小有关，预计30分钟~3小时。 export ASCEND_RT_VISIBLE_DEVICES=0 #设置使用NPU单卡执行模型量化 python examples/quantize.py --model-path /home/ma-user/llama-2-7b/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） > 推理模型量化

总条数： 989

上一页
1
...
37
38
39
...
50
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

精度校验 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

查看训练作业事件 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

查询数据集导入任务列表 - AI开发平台ModelArts

ascendfactory-cli方式启动（推荐） - AI开发平台ModelArts

给子账号配置文件夹级的SFS Turbo访问权限 - AI开发平台ModelArts

使用moxing适配OBS路径，pandas读取文件报错 - AI开发平台ModelArts

查询训练作业指定任务的日志（OBS链接） - AI开发平台ModelArts

扩缩容Standard专属资源池 - AI开发平台ModelArts

训练专属预置镜像列表 - AI开发平台ModelArts

从DLI导入数据到ModelArts数据集 - AI开发平台ModelArts

执行训练任务（推荐） - AI开发平台ModelArts

训练作业使用MoXing复制数据较慢，重复打印日志 - AI开发平台ModelArts

SDXL基于Lite Server适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

扩缩容Lite Cluster资源池 - AI开发平台ModelArts

管理Notebook实例 - AI开发平台ModelArts

什么是Workflow - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线