检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
单击“API管理”,进入API管理页签。 选择待发布的API,单击操作列的“发布”。 在“发布”页面配置API网关信息。 表1 发布服务 参数 说明 实例 发布为APIG的实例。API网关(API Gateway)是为企业和开发者提供的高性能、高可用、高安全的云原生网关服务,能快速将企业服务能力
用于调整模型对新Token的处理方式。即如果一个Token已经在之前的文本中出现过,那么模型在生成这个Token时会受到一定的惩罚。当presence_penalty的值为正数时,模型会更倾向于生成新的、未出现过的Token,即模型会更倾向于谈论新的话题。 最小值:-2 最大值:2 最小值:-2 最大值:2
Studio大模型即服务平台选择合适的模型,创建为“我的模型”。操作指导请参见在MaaS中创建模型。 将创建好的模型部署为模型服务,具体操作请参见使用MaaS部署模型服务。 选择使用AppCode认证方式调用部署好的模型服务,具体操作请参见调用MaaS部署的模型服务。 获取并记录模型服务的“调用模型名称
rompt的格式。 模型配置 文本多样性(top_p) 通过限制词汇的选择来控制生成文本的多样性。值越高,候选单词越多,文本多样性越高。默认值为0.1。 模型生成最大新词数(max_tokens) 控制文本的最大生成长度,值越大有助于生成较长或完整的回复;值较小,生成的内容越简洁。默认值为2048。
慎操作。 删除包年/包月的服务 包年包月计费方式的服务支持退订/释放,退订/释放服务后,服务将会释放资源并清空数据,且无法恢复,即删除了该服务。 登录云搜索服务管理控制台。 选择需要退订的服务,在操作列单击“更多”>“退订/释放”。 输入需要退订/释放的服务名称,单击“确定”。
最大值:65535 缺省值:1 page_size 否 Integer 请求限定响应结果的分页大小,例如5条/页,10条/页 最小值:1 最大值:65535 缺省值:10 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String
对于“获取用户Token”接口,您可以从接口的请求部分看到所需的请求参数及参数说明。将消息体加入后的请求如下所示,加粗的斜体字段需要根据实际值填写,其中username为用户名,********为用户的登录密码,domainname为用户所属的账号名称,如果是账号本身获取token,
top_p 否 Float 通过限制词汇的选择来控制生成文本的多样性。值越高,候选单词越多,文本多样性越高。 最小值:0.1 最大值:1 缺省值:0.1 max_tokens 否 Integer 模型生成最大新词数 最小值:1 最大值:131072 缺省值:131072 chat_temperature
参数类型 描述 context_length 是 Integer 上下文长度,即NLP大模型在进行一次特定的推理时可以考虑的最大令牌数 最小值:4 最大值:128 缺省值:4 响应参数 状态码: 400 表7 响应Body参数 参数 参数类型 描述 error_code String
切片效果 管理文档数据。 单击操作列的“下载”,可下载文档至本地。 单击操作列的“删除”,可删除已上传的文档。 单击操作列的“QA生成”,可将上传的文档生成问答模式的Excel文档,生成任务在“任务管理”页签可以查看。 单击操作列的“重试”,可对已上传的文档重新进行切片。 创建FAQ
API概览 Koosearch提供的接口为符合RESTful API设计规范的自研接口。通过Koosearch的自研接口,您可以使用Koosearch的表1 接口说明所示的功能。 表1 接口说明 类型 说明 知识库管理接口 知识库管理等相关接口。 结构化数据接口 将结构化数据文件纳入系统进行管理接口。
开时,阈值为0-1 最小值:0 最大值:200 chat_ref_threshold Float 参考文档过滤的阈值,精排关闭时,阈值为0-200,精排打开时,阈值为0-1 最小值:0 最大值:200 faq_threshold Float FAQ直出阈值:超过阈值的FAQ会作为答案直接输出,不需要经过大模型总结
参数类型 描述 context_length 是 Integer 上下文长度,即NLP大模型在进行一次特定的推理时可以考虑的最大令牌数 最小值:4 最大值:128 缺省值:4 响应参数 状态码: 400 表8 响应Body参数 参数 参数类型 描述 error_code String
在此界面获取"知识库ID"字段的值,表示该知识库在向量数据库中存储的ID,具有唯一性 最小长度:1 最大长度:64 content 是 String 搜索内容 最小长度:1 最大长度:10000 page_num 是 Integer 页码,范围1~65535 最小值:1 最大值:65535 page_size
Token的有效期为24小时,需要使用同一个Token鉴权时,可以缓存起来,避免频繁调用。 Token在计算机系统中代表令牌(临时)的意思,拥有Token就代表拥有某种权限。Token认证就是在调用API的时候将Token加到请求消息头,从而通过身份认证,获得操作API的权限。 T
开时,阈值为0-1 最小值:0 最大值:200 chat_ref_threshold Float 参考文档过滤的阈值,精排关闭时,阈值为0-200,精排打开时,阈值为0-1 最小值:0 最大值:200 faq_threshold Float FAQ直出阈值:超过阈值的FAQ会作为答案直接输出,不需要经过大模型总结
Float 搜索接口过滤的阈值,精排关闭时,阈值为0-200,精排打开时,阈值为0-1 最小值:0 最大值:200 chat_ref_threshold 否 Float 参考文档过滤的阈值,精排关闭时,阈值为0-200,精排打开时,阈值为0-1 最小值:0 最大值:200 faq_threshold
文档可以有一个或多个标签 3.建议格式为:标签名称:标签值 ,如果能够保证标签值不冲突,也可以直接使用 标签值,例如 《冰箱使用说明书》对应的产品型号:ProductModel:BCD-551WLCTDAFA5U1 《一句顶一万句》的作者是:刘震云 《外观设计专利交底书模板》 的专业领域是:法务领域
文档可以有一个或多个标签 3.建议格式为:标签名称:标签值 ,如果能够保证标签值不冲突,也可以直接使用 标签值,例如 《冰箱使用说明书》对应的产品型号:ProductModel:BCD-551WLCTDAFA5U1 《一句顶一万句》的作者是:刘震云 《外观设计专利交底书模板》 的专业领域是:法务领域
请求页码 最小值:1 最大值:65535 缺省值:1 page_size 否 Integer 请求限定响应结果的分页大小,例如5条/页,10条/页 最小值:1 最大值:65535 缺省值:10 category 否 String 文档目录,单值,对应目录树中的叶子节点 建议格式为 叶子节