搜索_华为云

SDXL基于Standard适配PyTorch NPU的LoRA训练指导（6.3.907） - AI开发平台ModelArts

义，然后选择上传到SWR的自定义镜像。代码目录：选择上传到OBS的代码文件夹，例如/sdxl-train/code。如果用户需要修改代码文件，可修改OBS桶中代码文件，创建训练作业时，会将OBS的code目录复制到训练容器的/home/ma-user/sdxl-train/us

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
SDXL基于Standard适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

定义，然后选择上传到SWR的自定义镜像。代码目录：选择上传到OBS的代码文件夹，例如/sdxl-train/code。若用户需要修改代码文件，可修改OBS桶中代码文件，创建训练作业时，会将OBS的code目录复制到训练容器的/home/ma-user/sdxl-train/us

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
认证鉴权 - AI开发平台ModelArts
认证鉴权 - AI开发平台ModelArts

求进行加密签名。 SK(Secret Access Key)：与访问密钥ID结合使用的密钥，对请求进行加密签名，可标识发送方，并防止请求被修改。使用AK/SK认证时，您可以基于签名算法使用AK/SK对请求进行签名，也可以使用专门的签名SDK对请求进行签名。详细的签名方法和SDK使用方法请参见API签名指南。

帮助中心 > AI开发平台ModelArts > API参考 > 如何调用API
使用kv-cache-int8量化 - AI开发平台ModelArts

json文件，里面是提取的per-tensor的scale值。内容示例如下：注意： 1、抽取完成后，可能提取不到model_type信息，需要手动将model_type修改为指定模型，如"llama"。 2、当前社区vllm只支持float8的kv_cache量化，抽取脚本中dtype类型是"float8_e

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
部署推理服务 - AI开发平台ModelArts

如果使用模型训练后的权重文件进行推理，模型训练及训练后的权重文件转换操作可以参考相关文档章节中提供的模型训练文档。 Step4 启动容器镜像启动容器镜像前请先按照参数说明修改${}中的参数。 docker run -itd \ --device=/dev/davinci0 \ --device=/dev/davinci1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.904）
示例：创建DDP分布式训练（PyTorch+GPU） - AI开发平台ModelArts

nprocs=n_gpus, join=True) torchlaunch.sh内容如下： #!/bin/bash # 系统默认环境变量，不建议修改 MASTER_HOST="$VC_WORKER_HOSTS" MASTER_ADDR="${VC_WORKER_HOSTS%%,*}" MASTER_PORT="6060"

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
自动学习训练作业失败 - AI开发平台ModelArts

可单击“默认加密”选项进行修改。图1 OBS桶是否加密确保归档数据直读功能关闭进入OBS管理控制台，选择当前自动学习项目使用的OBS桶，单击桶名称进入概览页。确保此OBS桶的归档数据直读功能关闭。如果此功能开启，可单击“归档数据直读”选项进行修改。图2 关闭归档数据直读功能

 帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 模型训练
创建智能标注作业 - AI开发平台ModelArts

创建智能标注作业除了人工标注外，ModelArts还提供了智能标注功能，快速完成数据标注，为您节省70%以上的标注时间。智能标注是指基于当前标注阶段的标签及图片学习训练，选中系统中已有的模型进行智能标注，快速完成剩余图片的标注操作。背景信息目前只有“图像分类”和“物体检测”类型的标注作业支持智能标注功能。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过智能标注方式标注数据
查看训练作业事件 - AI开发平台ModelArts

查看训练作业事件训练作业的（从用户可看见训练任务开始）整个生命周期中，每一个关键事件点在系统后台均有记录，用户可随时在对应训练作业的详情页面进行查看。方便用户更清楚的了解训练作业运行过程，遇到任务异常时，更加准确的排查定位问题。当前支持的作业事件如下所示：训练作业创建成功训练作业创建失败报错：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
训练的数据集预处理说明 - AI开发平台ModelArts

即可用户自定义执行数据处理脚本修改参数说明若用户要自定义数据处理脚本并且单独执行，同样以 llama2 为例。方法一：用户可打开scripts/llama2/1_preprocess_data.sh脚本，将执行的python命令复制下来，修改环境变量的值，进入到 /home

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
训练的数据集预处理说明 - AI开发平台ModelArts

可用户自定义执行数据处理脚本修改参数说明如果用户要自定义数据处理脚本并且单独执行，同样以 llama2 为例。方法一：用户可打开scripts/llama2/1_preprocess_data.sh脚本，将执行的python命令复制下来，修改环境变量的值，进入到 /home

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907） > 训练脚本说明
SD3 Diffusers框架基于DevServer适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

diffusers-sd3-inference:0.0.1 . Step4 启动镜像启动容器镜像，推理只需要启动单卡，启动前可以根据实际需要增加修改参数。 docker run -itd --name ${container_name} -v /sys/fs/cgroup:/sys/fs/cgroup:ro

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
准备镜像环境 - AI开发平台ModelArts

diffusers-train:0.0.1 . Step4 启动镜像启动容器镜像，fintune全量微调需要启动8卡，启动前可以根据实际需要增加修改参数。 docker run -itd --name ${container_name} -v /sys/fs/cgroup:/sys/fs/cgroup:ro

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
使用kv-cache-int8量化 - AI开发平台ModelArts

json文件，里面是提取的per-tensor的scale值。内容示例如下：注意：抽取完成后，可能提取不到model_type信息，需要手动将model_type修改为指定模型，如"llama"。当前社区vllm只支持float8的kv_cache量化，抽取脚本中dtype类型是"float8_e4m

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

# 推理代码包 |──llm_tools # 推理工具下载代码之后需要修改llm_train/AscendSpeed/scripts/install.sh文件。具体为删除install.sh的第43行 "git cherrypick

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 准备工作
更新团队标注验收任务状态 - AI开发平台ModelArts

__WORKFORCE_SAMPLED_REJECTED__：采样已驳回 __AUTO_ANNOTATION__：待确认 sample_time Long 样本时间，OBS最后修改时间。 sample_type Integer 样本类型。可选值如下： 0：图像 1：文本 2：语音 4：表格 6：视频 9：自由格式 score

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询单个样本信息 - AI开发平台ModelArts

__WORKFORCE_SAMPLED_REJECTED__：采样已驳回 __AUTO_ANNOTATION__：待确认 sample_time Long 样本时间，OBS最后修改时间。 sample_type Integer 样本类型。可选值如下： 0：图像 1：文本 2：语音 4：表格 6：视频 9：自由格式 score

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
Open-Sora 1.0基于DevServer适配PyTorch NPU训练指导（6.3.905） - AI开发平台ModelArts

{image_url}参见表2。 docker pull {image_url} 启动容器镜像。启动前请先按照参数说明修改${}中的参数。可以根据实际需要增加修改参数。训练至少需要单机8卡，推理需要单机单卡。 export work_dir="自定义挂载的工作目录" export

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
查询单个智能标注样本的信息 - AI开发平台ModelArts

__WORKFORCE_SAMPLED_REJECTED__：采样已驳回 __AUTO_ANNOTATION__：待确认 sample_time Long 样本时间，OBS最后修改时间。 sample_type Integer 样本类型。可选值如下： 0：图像 1：文本 2：语音 4：表格 6：视频 9：自由格式 score

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查看作业详情 - AI开发平台ModelArts

如何查看训练作业资源占用情况？如何访问训练作业的后台？两个训练作业的模型都保存在容器相同的目录下是否有冲突？训练输出的日志只保留3位有效数字，是否支持更改loss值？训练好的模型是否可以下载或迁移到其他账号？如何获取下载路径？父主题： Standard训练作业

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业

总条数： 800

上一页
1
...
29
30
31
...
40
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

SDXL基于Standard适配PyTorch NPU的LoRA训练指导（6.3.907） - AI开发平台ModelArts

SDXL基于Standard适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

认证鉴权 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

示例：创建DDP分布式训练（PyTorch+GPU） - AI开发平台ModelArts

自动学习训练作业失败 - AI开发平台ModelArts

创建智能标注作业 - AI开发平台ModelArts

查看训练作业事件 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

SD3 Diffusers框架基于DevServer适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

更新团队标注验收任务状态 - AI开发平台ModelArts

查询单个样本信息 - AI开发平台ModelArts

Open-Sora 1.0基于DevServer适配PyTorch NPU训练指导（6.3.905） - AI开发平台ModelArts

查询单个智能标注样本的信息 - AI开发平台ModelArts

查看作业详情 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线