AI开发平台MODELARTS-在模型广场查看模型:模型介绍
模型介绍
表1列举了ModelArts Studio大模型即服务平台支持的模型清单,模型详细信息请查看界面介绍。
模型系列 |
模型类型 |
应用场景 |
支持语言 |
---|---|---|---|
GLM-4 |
文本生成 |
对话问答、长文本推理、代码生成 |
中文、英文 |
ChatGLM3 |
文本生成 |
对话问答、数学推理、代码生成 |
中文、英文 |
百川2 |
文本生成 |
对话问答、数学推理、代码生成、翻译 |
中文、英文 |
Llama 2 |
文本生成 |
对话问答、智能创作、文本摘要 |
英文 |
Llama 3 |
文本生成 |
对话问答、智能创作、文本摘要 |
英文 |
Llama 3.1 |
文本生成 |
对话问答、智能创作、文本摘要 |
英文 |
Yi |
文本生成 |
代码生成、数学推理、对话问答 |
中文、英文 |
通义千问1.5 |
文本生成 |
代码生成、数学推理、对话问答 |
英文 |
通义千问 |
文本生成 |
对话问答、智能创作、文本摘要、翻译、代码生成、数学推理 |
中文、英文 |
通义千问2 |
文本生成 |
多语言处理、数学推理、对话问答 |
英文 |
通义千问2.5 |
文本生成 |
多语言处理、数学推理、对话问答 |
中文、英文 |
Deepseek Coder |
文本生成 |
对话问答、文本推理 |
中文、英文 |
模型分为量化模型和非量化模型,其中,量化模型又包括SmoothQuant-W8A8和AWQ-W4A16两种。
- AWQ-W4A16量化模型可以由非量化模型压缩后生成,也可以直接使用开源AWQ权重。
- SmoothQuant-W8A8量化模型只能由非量化模型压缩生成。
ModelArts Studio大模型即服务平台已预置非量化模型与AWQ-W4A16量化模型的模型模板。
- 非量化模型可以支持调优、压缩、部署等操作。
- 量化模型仅支持部署操作。当需要获取SmoothQuant-W8A8量化模型时,则可以通过对非量化模型进行模型压缩获取。