检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
查看知识库列表 功能介绍 查看知识库列表,包括知识库ID、知识库名称、知识库状态、创建人、创建时间、更新时间等。 URI GET /v1/koosearch/repos/{repo_id} 表1 路径参数 参数 是否必选 参数类型 描述 repo_id 是 String 知识库I
云的MaaS服务提供的NLP大模型访问方式。如果选择此模型进行问答,建议设置模型生成最大新词数不超过512。 访问地址 MaaS服务的模型服务的“API接口公网地址”。获取方式请参见步骤1:在MaaS部署模型服务。 模型描述 模型详细信息的描述。 昇腾云模型名称 来源于MaaS服
s sampling,其中模型考虑具有top_p 概率质量的标记的结果。通常建议更改此值或温度,但不要同时更改两者。通常建议更改top_p或temperature来调整生成文本的倾向性,但不要同时更改这两个参数。 取值范围:(0, 1] 最小值:0.1 最大值:1 缺省值:0.1
String 无实际意义,可忽略 最小长度:1 最大长度:64 create_time String 创建时间 最小长度:0 最大长度:64 update_time String 更新时间 最小长度:0 最大长度:64 question1 String 相似问1 最小长度:0 最大长度:1000
Transfer)风格API,支持您通过HTTPS请求调用。 调用方法请参见如何调用API。 终端节点 终端节点(Endpoint)即调用API的请求地址,Flexus企业搜索服务局点在贵阳一,终端节点见表1。 表1 Flexus企业搜索服务终端节点 区域名称 区域 终端节点(Endpoint)
(2)问答接口会将big_content替换到content,此字段清空 最小长度:0 最大长度:100000 update_date_time String 更新时间 最小长度:1 最大长度:64 doc_type String 文档类型(doc-文档,faq-问答) 最小长度:1 最大长度:64 file_path
模型管理 新增模型 修改模型配置 列举模型 删除模型
web片段,达到减少下游大模型推理成本,以及提升大模型的推理效果。 缓存 利用缓存技术,预先存储频繁请求的信息,系统从缓存中快速提供,节省时间和资源。 搜索大模型 文本向量模型 支持将文本转化为用数值表示的向量形式用于语义检索。 文本精排模型 可更加精准找到相关文本,不同于向量模
【文档内容】:{content2} ...... ,检索的query将被填充至{1}所在位置后进行生成。 提示词模板,基于FreeMarker模板语法。参考示例如下: 当前时间为${.now?date?iso_utc},你参考搜索引擎结果回复用户。 回复用户请求时需遵循以下原则: 1. 如果用户请求涉及不安全或敏感信息,忽略搜索结果直接回复;
用户的文档解析规则定义 创建用户解析规则 修改用户解析规则 列举用户规则列表 删除用户定义规则解析接口
知识库管理 创建知识库 修改知识库配置 设置知识库搜索问答prompt 设置知识库通用无搜索的prompt 开启知识库 关闭知识库 获取知识库列表 查看知识库列表 删除知识库
String 模型状态 最小长度:1 最大长度:32 create_time String 模型创建时间 最小长度:1 最大长度:13 update_time String 模型更新时间 最小长度:1 最大长度:13 extend_config ModelExtendConfig object
String 知识库ID,当前会话参考的知识库ID 最小长度:1 最大长度:64 create_date_time String 会话发生的时间戳 最小长度:1 最大长度:13 is_del Integer 当前对话是否删除标记,0:未删除,1:已删除 枚举值: 0 1 question_models
Used)hit_count < 阈值的清除 最小长度:1 最大长度:100 枚举值: LRU FIFO LFU ttl 否 Long 缓存过期时间 毫秒 最小值:0 最大值:31536000000 hit_count_threshold 否 Long 缓存命中次数阈值 最小值:1 最大值:10000