AI开发平台MODELARTS-昇腾云服务6.3.T061版本说明:支持的特性

时间:2024-09-07 17:47:12

支持的特性

表1 本版本支持的特性说明

分类

软件包特性说明

参考文档

三方大模型,包名:AscendCloud-3rdLLM

支持如下模型适配PyTorch-NPU的训练。

  1. llama2-7b
  2. llama2-13b
  3. llama2-70b
  4. qwen-7b
  5. qwen-14b
  6. qwen-72b
  7. baichuan2-13b
  8. chatglm3-6b
  9. llama3-8b
  10. llama3-70b
  11. yi-6B
  12. yi-34B
  13. qwen1.5-7B
  14. qwen1.5-14B
  15. qwen1.5-32B
  16. qwen1.5-72B

支持如下模型适配PyTorch-NPU的推理。

  1. llama-7B
  2. llama-13b
  3. llama-65b
  4. llama2-7b
  5. llama2-13b
  6. llama2-70b
  7. llama3-8b
  8. llama3-70b
  9. yi-6b
  10. yi-9b
  11. yi-34b
  12. deepseek-llm-7b
  13. deepseek-llm-67b
  14. qwen-7b
  15. qwen-14b
  16. qwen-72b
  17. qwen1.5-0.5b
  18. qwen1.5-7b
  19. qwen1.5-1.8b
  20. qwen1.5-14b
  21. qwen1.5-32b
  22. qwen1.5-72b
  23. qwen1.5-110b
  24. baichuan2-7b
  25. chatglm2-6b
  26. chatglm3-6b
  27. mistral-7b
  28. mixtral 8*7B

支持如下推理特性:

  1. llama系列推理支持bf16数据类型
  2. llama系列推理支持w8a8、w4a16量化
  3. 支持MoE-mixtral 8*7B推理
  4. vllm推理框架支持prefix caching

算子,包名:AscendCloud-OPP

提供配套的推理量化算子

support.huaweicloud.com/bulletin-modelarts/bulletin-modelarts_0016.html