检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
l/目录中。 获取精度测试代码。精度测试代码存放在代码包AscendCloud-LLM的llm_tools/llm_evaluation/mme_eval目录中,代码目录结构如下。 mme_eval ├──metric.py #MME精度测试脚本 ├──MME.sh
diffusers_sdxl_controlnet_train.sh 训练执行成功如下图所示。 图1 训练执行成功 父主题: SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU训练指导(6.3.908)
vLLM是GPU平台上广受欢迎的大模型推理框架,因其高效的continuous batching和pageAttention功能而备受青睐。此外,vLLM还具备投机推理和自动前缀缓存等关键功能,使其在学术界和工业界都得到了广泛应用。 Ascend-vLLM是华为云针对NPU优化的推理框架,继承了vLLM的
SD1.5&SDXL Koyha框架基于DevServer适配PyTorch NPU训练指导(6.3.908) 训练场景和方案介绍 准备镜像环境 Finetune训练 LoRA训练 父主题: 文生图模型训练推理
SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU训练指导(6.3.908) 训练场景和方案介绍 准备镜像环境 Finetune训练 LoRA训练 Controlnet训练 父主题: 文生图模型训练推理
SD3 Diffusers框架基于DevServer适配PyTorch NPU推理指导(6.3.907) Stable Diffusion(简称SD)是一种基于扩散过程的图像生成模型,应用于文生图场景,能够帮助用户生成图像。 方案概览 本方案介绍了在ModelArts Lite
ep_time.txt文本中 autoxl_log/log/目录下存放各个shapes的数据。 父主题: SD1.5&SDXL Koyha框架基于DevServer适配PyTorch NPU训练指导(6.3.908)
SD3 Diffusers框架基于DevServer适配PyTorch NPU推理指导(6.3.912) Stable Diffusion(简称SD)是一种基于扩散过程的图像生成模型,应用于文生图场景,能够帮助用户生成图像。 方案概览 本方案介绍了在ModelArts Lite
所有数据保存在auto_log/avg_step_time.txt文本中 auto_log/log/目录下存放各个shapes的数据 父主题: SD1.5&SDXL Koyha框架基于DevServer适配PyTorch NPU训练指导(6.3.908)
当用户使用基于MPI和Horovod框架的自定义镜像进行分布式训练时,需配置训练作业节点间SSH免密互信,否则训练会失败。 配置节点间SSH免密互信涉及代码适配和训练作业参数配置,本文提供了一个操作示例。 准备一个预装OpenSSH的自定义镜像,使用的训练框架是MPI或Horovod。
#例如:sudo chown -R ma-user:ma-group /home/ma-user/ws 父主题: SD1.5&SDXL Koyha框架基于DevServer适配PyTorch NPU训练指导(6.3.908)
diffusers_sdxl_lora_train.sh 训练执行成功如下图所示。 图1 训练执行成功 父主题: SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU训练指导(6.3.908)
代码中涉及到的OBS路径,请用户替换为自己的实际OBS路径。 代码是以PyTorch为例编写的,不同的AI框架之间,整体流程是完全相同的,仅需修改7和11中的 framework_type参数值即可,例如:MindSpore框架,此处framework_type=Ascend-Powered-Engine。
--checkpointing_steps=5000 训练执行成功如下图所示。 图1 训练执行成功 父主题: SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU训练指导(6.3.908)
署为在线服务的免费体验过程。 第三方推理框架迁移到ModelArts Standard推理自定义引擎 第三方框架 推理部署 - ModelArts支持第三方的推理框架在ModelArts上部署,本文以TFServing框架、Triton框架为例,介绍如何迁移到推理自定义引擎。 第三方案例列表
续命令。 docker exec -it ${container_name} bash 父主题: SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU训练指导(6.3.908)
sult_{timestamp}.csv属于API级,标明每个API是否通过测试。建议用户先查看accuracy_checking_result_{timestamp}.csv文件,对于其中没有通过测试的或者特定感兴趣的API,根据其API name字段在 accuracy_ch
可选“最大化”或者“最小化”。 指标正则 填入正则表达式。您可以单击智能生成功能自动获取正则表达式。 设置自动化搜索参数 从已设置的“超参”中选择可用于搜索优化的超参。优化的超参仅支持float类型,选中自动化搜索参数后,需设置取值范围。 搜索算法配置 ModelArts内置三种超参搜索算法,用户
获取某个超参敏感度分析图像的保存路径。 提前终止自动化搜索作业的某个trial 提前终止自动化搜索作业的某个trial。 获取自动化搜索作业yaml模板的信息 获取自动化搜索作业yaml模板的信息。 获取自动化搜索作业yaml模板的内容 获取自动化搜索作业yaml模板的内容。 表8 训练作业标签管理接口
base块:基础配置块 ModelName块:该模型所需配置的参数,如qwen2.5-7b块 样例截图如下: 开始训练测试,具体步骤参考训练性能测试或训练精度测试,根据实际情况决定。 父主题: 训练benchmark工具