检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
配置NFS网盘服务。 大模型采用镜像+模型分开的方式部署时,需要有一个节点来提供NFS网盘服务,创建部署时通过NFS挂载的方式访问模型。 父主题: 部署为边缘服务
考时间”,用更多的计算资源解决该问题。 自洽性 同一问题使用大模型回答多次,生成多个推理路径及答案,选择一致性最高的结果作为最终答案。 父主题: 进阶技巧
词汇重复度控制 用于调整模型对频繁出现的Token的处理方式。 历史对话保留轮数 选择“多轮对话”功能时具备此参数,表示系统能够记忆的历史对话数。 父主题: 调用盘古大模型
Authorization:Bearer your-key 当LLM被定义好之后,使用方式与盘古大模型相同,开源模型也支持Agent调用,可参考实例化Agent。 父主题: LLMs(语言模型)
么情况下,我们都应该保持对他人的尊重和礼貌,并且以积极、正向和安全的方式回答问题。"} 状态码 请参见状态码。 错误码 请参见错误码。 父主题: NLP大模型
扩缩容是指运行中的模型支持增加或减少模型部署的实例数。 修改部署时扩缩容和外推场景互斥,每次只能修改一个。 图2 修改部署 图3 模型部署扩缩容 父主题: 部署盘古大模型
核采样值, 和temperature不同时配置 presence_penalty: Optional[float] # 存在惩罚,增加模型谈论新主题的可能性,范围见具体模型API规范 frequency_penalty: Optional[float] # 频率惩罚,降低模型重复的可
PANGU)); System.out.println(docSkill.executeWithDocs(docs, query)); 父主题: Skill(技能)
of(LLMs.PANGU)); System.out.println(docSkill.executeWithDocs(docs)); 父主题: Skill(技能)
) 上面的例子中,当满足if判断条件时,就会直接终止agent的执行,并且agent的finalAnswer被设置为工具的原始返回值。 父主题: Agent(智能代理)
配置sdk配置项,指定prompt文件根路径,以 /home 目录下为例 sdk.prompt.path=/home/prompts/default 父主题: Java SDK
ll(LLMs.of("pangu")) print(doc_skill.execute({"documents": docs})) 父主题: Skill(技能)
执行如下命令查看节点状态。 kubectl get node -o wide 如果所有节点状态STATUS为“Ready”,则说明集群创建成功。 父主题: 部署为边缘服务
updateAgentSession(sessionId, agentSession); return agentSession; } } 父主题: 应用实践
"request_id": "469967f55e6b225xxx" } 其中,error_code表示错误码,error_msg表示错误描述信息。 父主题: 如何调用REST API
将“最大口令限制”参数调小,如改为98,保持其他参数不变,单击“重新生成”,可以看到模型回复内容长度减小。 图8 修改“最大口令限制”参数 父主题: 体验盘古大模型功能
谈,如果用户没有输入问题,我会介绍我自己和我的工作流程,等待用户的提问。 图1 创建AI助手 单击“立即创建”完成AI助手的创建工作。 父主题: AI助手
of("pangu")) print(doc_skill.execute({"documents": docs, "question": query})) 父主题: Skill(技能)
false; } }); 上述例子中,当满足if判断条件时,会直接终止Agent的执行,且finalAnswer被设置为工具的原始返回值。 父主题: Agent(智能代理)
到这里为止这个请求需要的内容就具备齐全了,您可以使用curl、Postman或直接编写代码等方式发送请求调用API。对于接口,您可以从响应消息部分看到返回参数及参数说明。 父主题: 如何调用REST API