云服务器内容精选

华为云首页用户手册

大模型推理场景

数智融合计算服务-大模型推理场景介绍

大模型推理场景介绍常见的大模型包括大语言模型、多模态大模型、文生图大模型等，其中大语言模型支持文本生成，可以根据用户输入的提示词（prompt）进行推理，可广泛应用于以下领域：问答系统：大语言模型可以处理自然语言，理解用户的意图，回答用户提出的问题。内容生产：大语言模型可以基于给定的文本或主题生成连贯的文章、故事、对话等。文本摘要：大语言模型可以对长文本进行摘要，提取关键信息，方便用户快速了解文本内容。机器翻译：大语言模型可以处理多种语言之间的翻译任务，实现跨语言交流。当前Fabric提供以下两种方式进行推理：用公共推理服务进行推理：Fabric提供基于开源大语言模型（Qwen2、GLM4等）的公共推理服务，用户可以在推理端点查看公共端点，选择自己想用的端点进行开通，然后就可以在试验场使用公共推理服务。该方式无需部署，开通后即可使用常见的开源大模型进行推理。创建我的推理服务进行推理：Fabric支持用户创建自己专属的推理服务进行部署，用户可以上传自己的大语言模型，也可以使用公共的大语言模型进行部署。在Fabric模型页面创建的模型是仅自己可见，其他用户不可见。用户可以查看和删除模型，也可以对模型版本进行管理，包括新增、查看和删除模型版本。父主题：大模型推理场景

数智融合计算服务大模型推理场景