检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
主账号(最终租户)默认拥有系统管理员权限,支持给子账号分配角色。 角色包括:推理服务API调用人员、模型开发人员、运营人员、Prompt工程人员、系统管理员。
应用场景 智能客服 在政企场景中,传统的智能客服系统常受限于语义泛化能力和意图理解能力,导致用户需求难以准确捕捉,频繁转接至人工客服。这不仅增加了企业的运营成本,也影响了用户体验。盘古大模型的引入为这一问题提供了有效解决方案。
adjective="funny", content="chickens") assert "Tell me a funny joke about chickens" == format2 自定义prompt # 按约定的格式准备prompt文件; # 文档结构和文件名参考提供的系统预置
截断窗口大小:指在处理用户的历史对话信息时,系统会保留最近的N个对话传递给模型。 历史关键信息抽取 用于截取历史对话中的关键信息,将关键信息带入当前轮次的对话中。 该参数需要与工具配合使用,需要填入工具input_schema参数中API的请求参数。
历史对话保留轮数 选择“多轮对话”功能时具备此参数,表示系统能够记忆的历史对话数。 父主题: 调用盘古大模型
华为云租户的安全责任在于对使用的IaaS、PaaS和SaaS类云服务内部的安全以及对租户定制配置进行安全有效的管理,包括但不限于虚拟网络、虚拟主机和访客虚拟机的操作系统,虚拟防火墙、API网关和高级安全服务,各项云服务,租户数据,以及身份账号和密钥管理等方面的安全配置。
模型持续优化: 本场景采用了下表中的推理参数进行解码,您可以在平台部署后参考如下参数调试: 表3 推理核心参数设置 推理参数 设置值 最大Token限制(max_token) 4096 温度(temperature) 0.3 核采样(top_p) 1.0 话题重复度控制(presence_penalty
订阅提醒 勾选订阅提醒,并添加手机号/邮箱,系统将在训练任务完成或重要事件发生时,发送提醒。 表2 部署实例量与推理单元数关系 模型类型 推理资源 盘古-NLP-N1系列模型 4K版本: 当部署一个实例时,占用0.125个推理单元。
模型持续优化: 本场景采用了下表中的推理参数进行解码,您可以在平台部署后参考如下参数调试: 表2 推理核心参数设置 推理参数 设置值 最大Token限制(max_token) 1024 温度(temperature) 0.3 核采样(top_p) 0.8 话题重复度控制(presence_penalty
fewShotPromptTemplate,得到最终fewShotPrompt String prompt = fewShotPromptTemplate.format(inputs); 自定义prompt // 按约定的格式准备prompt文件; // 文档结构和文件名参考提供的系统预置
参数设置为10,表示包括5个用户查询和5个系统响应。该参数只涉及多轮对话功能。 体验预置模型文本补全能力 进入“文本补全”页签,选择模型与示例,参数设置为默认参数,在输入框输入问题,单击“生成”,模型将基于问题进行回答。
参数设置为10,表示包括5个用户查询和5个系统响应。该参数只涉及多轮对话功能。 体验预置模型文本补全能力 进入“文本补全”页签,选择模型与示例,参数设置为默认参数,在输入框输入问题,单击“生成”,模型将基于问题进行回答。