检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
chat_history_id 是 String 对话历史ID。获取方式:【对话管理】-【对话历史】中的【对话ID】,即为【对话问题】所对应的【对话ID】 最小长度:1 最大长度:64 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 接
对话历史 查询对话历史列表 获取对话历史 删除对话历史 批量删除对话历史
批量删除对话历史 功能介绍 根据对话ID,批量删除对话历史信息。 URI DELETE /v1/koosearch/chat-history/batch 请求参数 表1 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 接口鉴权使用
查询对话历史列表 功能介绍 查询历史问题列表。包含对话ID、对话问题、用户名、对话开始时间。 URI GET /v1/koosearch/chat-history 表1 Query参数 参数 是否必选 参数类型 描述 user_name 否 String 用户名 最小长度:1 最大长度:64
删除对话历史 功能介绍 根据指定ID,删除对应的对话历史。 URI DELETE /v1/koosearch/chat-history/{chat_history_id} 表1 路径参数 参数 是否必选 参数类型 描述 chat_history_id 是 String 对话历史ID
进入“文档管理”页面。 单击“FAQ管理”,切换至“FAQ管理”页签。 单击“创建”,在“新建问答”对话框中输入“标准问题”和“答案”,单击“添加相似问题”,可输入多个相似问题。 在对话框中单击“确认”。 FAQ创建后,可在FAQ管理页签查看已创建的问答。 管理FAQ。 单击操作列的
全的问题。 查看历史对话 针对已进行的问答体验,可在对话历史页面查看历史对话记录。 在KooSearch控制台,左侧导航栏选择“对话管理 > 对话历史”。 在“对话历史”页面,查看对话内容,单击操作列的“查看”进入对话详情页面。 如果无需保留历史对话,可在对话历史页面单击操作列的
create_flag"应为"1",表示需要开启新的对话;当"chat_id"有值时,"chat_create_flag"可以为"0",表示不需要开启新的对话。 "messages"中的元素必须为奇数个,单轮对话时为1,多轮对话时为3、5、7、...,如 [question1, answer1
务。 Embedding模型服务:基于盘古大模型技术的文本表示模型,将文本转化为用数值表示的向量形式,用于文本检索、聚类、推荐等场景。 精排模型服务:基于盘古大模型技术的文本表示模型,将文本转化为用数值表示的向量形式,用于文本检索、聚类、推荐等场景,语义搜索场景下,加入了精排模型,提升搜索的效果。
配置”,在弹窗中设置模型的Prompt。 下面以通用问答场景的Prompt举例。 你结合对话历史和给定文档回复用户请求,遵循以下原则: 1.严格遵从文档原文术语和阐述逻辑; 2.如果结合对话历史和给定文档无法回复用户请求,请按照自己的知识回答。 文档的基础信息如下: {0} 问题:{1}
oSearch控制台。 选择知识库 在KooSearch控制台,左侧导航栏选择“体验平台”,进入体验平台页面。 单击右上角,在“资料来源”对话框勾选知识库,单击“确定”。 搜索体验将在所选择的知识库中进行搜索。 配置搜索 在“体验平台”页面单击右上角,在配置页面设置搜索配置。 “
效果最好的上下文长度,与模型相关,确保输入令牌的有效长度以保证最佳输出 考虑到多轮对话,建议控制在模型上下文长度的60%(向上取整)。 最小值:2 最大值:128 top_p 否 Float 通过限制词汇的选择来控制生成文本的多样性。值越高,候选单词越多,文本多样性越高。 最小值:0.1 最大值:1 缺省值:0
效果最好的上下文长度,与模型相关,确保输入令牌的有效长度以保证最佳输出 考虑到多轮对话,建议控制在模型上下文长度的60%(向上取整)。 最小值:2 最大值:128 top_p Float 通过限制词汇的选择来控制生成文本的多样性。值越高,候选单词越多,文本多样性越高。 最小值:0.1 最大值:1 缺省值:0.1
效果最好的上下文长度,与模型相关,确保输入令牌的有效长度以保证最佳输出 考虑到多轮对话,建议控制在模型上下文长度的60%(向上取整)。 最小值:2 最大值:128 top_p 否 Float 通过限制词汇的选择来控制生成文本的多样性。值越高,候选单词越多,文本多样性越高。 最小值:0.1 最大值:1 缺省值:0
效果最好的上下文长度,与模型相关,确保输入令牌的有效长度以保证最佳输出 考虑到多轮对话,建议控制在模型上下文长度的60%(向上取整)。 最小值:2 最大值:128 top_p Float 通过限制词汇的选择来控制生成文本的多样性。值越高,候选单词越多,文本多样性越高。 最小值:0.1 最大值:1 缺省值:0.1
利用缓存技术,预先存储频繁请求的信息,系统从缓存中快速提供,节省时间和资源。 搜索大模型 文本向量模型 支持将文本转化为用数值表示的向量形式用于语义检索。 文本精排模型 可更加精准找到相关文本,不同于向量模型输出向量,直接计算query和doc的相关性更加准确,可用于对向量召回结果的重新排序。
表8 对话历史接口 API 说明 查询对话历史列表 查询历史问题列表。包含对话ID、对话问题、用户名、对话开始时间。 获取对话历史 根据chat_id获取对话历史,返回历史的question和answer数据。 删除对话历史 根据指定ID,删除对应的对话历史。 批量删除对话历史 根据多个ID,批量删除对话历史信息。
endpoint 是 String 模型endpoint 最小长度:1 最大长度:512 type 是 String 模型类型 pangu_chat 盘古对话模型 pangu_llm 盘古裸机模型 embedding 向量模型 query2query query2query模型 rerank 精排模型
创建用户解析规则 功能介绍 用于创建用户自定义的解析规则,解析规则用于解析需要作为subtitle的文本,规则由上而下依次校验。 URI POST /v1/koosearch/rule-regex 请求参数 表1 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token
00080003 知识库关闭时不允许当前操作 知识库关闭时不允许当前操作。 知识库为关闭状态。 400 KOS.00080004 对话时间超期 对话时间超期。 建议重新开启新对话。 400 KOS.00080005 知识库更新失败 知识库更新失败。 请查看服务日志,根据具体问题分析服务异常。 400