AI开发平台MODELARTS-昇腾云服务6.3.908版本说明:支持的特性

时间:2024-09-14 23:53:34

支持的特性

表1 本版本支持的特性说明

分类

软件包特性说明

参考文档

三方大模型,包名:AscendCloud-LLM

支持如下模型适配PyTorch-NPU的训练(ModelLink)

  1. llama2-7b
  2. llama2-13b
  3. llama2-70b
  4. qwen-7b
  5. qwen-14b
  6. qwen-72b
  7. baichuan2-13b
  8. chatglm3-6b
  9. llama3-8b
  10. llama3-70b
  11. yi-6B
  12. yi-34B
  13. qwen1.5-7B
  14. qwen1.5-14B
  15. qwen1.5-32B
  16. qwen1.5-72B
  17. qwen2-0.5b
  18. qwen2-1.5b
  19. qwen2-7b
  20. qwen2-72b
  21. glm4-9b
  22. mistral-7b
  23. mixtral-8x7b

支持如下模型适配PyTorch-NPU的训练(LlamaFactory)

  1. llama2-7b
  2. llama2-13b
  3. llama2-70b
  4. llama3-8b
  5. llama3-70b
  6. llama3.1-8b
  7. llama3.1-70b
  8. qwen1.5-0.5b
  9. qwen1.5-1.8b
  10. qwen1.5-4b
  11. qwen1.5-7b
  12. qwen1.5-14b
  13. yi-6b
  14. yi-34b
  15. qwen2-0.5b
  16. qwen2-1.5b
  17. qwen2-7b
  18. qwen2-72b
  19. falcon-11B
  20. glm4-9b

LLM开源大模型基于DevServer适配ModelLinkPyTorch NPU训练指导(6.3.908)

LLM开源大模型基于DevServer适配LLamaFactory PyTorch NPU训练指导(6.3.908)

LLM开源大模型基于Standard+OBS适配PyTorch NPU训练指导(6.3.908)

LLM开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导(6.3.908)

支持如下模型适配PyTorch-NPU的推理。

  1. llama-7B
  2. llama-13b
  3. llama-65b
  4. llama2-7b
  5. llama2-13b
  6. llama2-70b
  7. llama3-8b
  8. llama3-70b
  9. yi-6b
  10. yi-9b
  11. yi-34b
  12. deepseek-llm-7b
  13. deepseek-coder-instruct-33b
  14. deepseek-llm-67b
  15. qwen-7b
  16. qwen-14b
  17. qwen-72b
  18. qwen1.5-0.5b
  19. qwen1.5-7b
  20. qwen1.5-1.8b
  21. qwen1.5-14b
  22. qwen1.5-32b
  23. qwen1.5-72b
  24. qwen1.5-110b
  25. qwen2-0.5b
  26. qwen2-1.5b
  27. qwen2-7b
  28. qwen2-72b
  29. baichuan2-7b
  30. baichuan2-13b
  31. chatglm2-6b
  32. chatglm3-6b
  33. glm-4-9b
  34. gemma-2b
  35. gemma-7b
  36. mistral-7b
  37. mixtral 8*7B
  38. falcon2-11b
  39. qwen2-57b-a14b
  40. llama3.1-8b
  41. llama3.1-70b
  42. llama-3.1-405B
  43. llava-1.5-7b
  44. llava-1.5-13b
  45. llava-v1.6-7b
  46. llava-v1.6-13b
  47. llava-v1.6-34b

ascend-vllm支持如下推理特性:

  1. 支持分离部署
  2. 支持多机推理
  3. 支持投机推理
  4. 支持chunked prefill特性
  5. 支持automatic prefix caching
  6. 支持multi-lora特性
  7. 支持W4A16、W8A16和W8A8量化

LLM开源大模型基于DevServer适配PyTorch NPU推理指导(6.3.908)

LLM开源大模型基于Standard适配PyTorch NPU推理指导(6.3.908)

AIGC,包名:AscendCloud-AIGC

支持如下框架或模型基于DevServer的PyTorch NPU推理:

  1. Stable-diffusion-webui
  2. Wav2Lip
  3. OpenSora1.2
  4. OpenSoraPlan1.0

支持如下框架或模型基于DevServer的PyTorch NPU的训练:

  1. Diffusers
  2. Koyha_ss
  3. Wav2Lip
  4. InternVL2
  5. OpenSora1.2
  6. OpenSoraPlan1.0

SD WEBUI套件适配PyTorch NPU的推理指导(6.3.908)

SDXL基于Standard适配PyTorch NPU的LoRA训练指导(6.3.908)

SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU训练指导(6.3.908)

SD1.5&SDXL Koyha框架基于DevServer适配PyTorch NPU训练指导(6.3.908)

InternVL2基于DevServer适配PyTorch NPU训练指导(6.3.908)

算子,包名:AscendCloud-OPP

  1. Scatter、Gather算子性能提升,满足MoE训练场景
  2. matmul、swiglu、rope等算子性能提升,支持vllm推理场景
  3. 支持random随机数算子,优化FFN算子,满足AIGC等场景
  4. 支持自定义交叉熵融合算子,满足BMTrain框架训练性能要求
  5. 优化PageAttention算子,满足vllm投机推理场景
  6. 支持CopyBlocks算子,满足vllm框架beam search解码场景

support.huaweicloud.com/bulletin-modelarts/bulletin-modelarts_0027.html