检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
模型类型 NLP模型-云底座:通过华为云提供的盘古nlp大模型访问方式。 NLP模型-昇腾云:通过昇腾云的MAAS服务提供的nlp大模型访问方式。如果选择此模型进行问答,建议设置模型生成最大新词数不超过512。 NLP模型-裸机:通过裸机部署提供的盘古nlp大模型访问方式。
扩展请求头 deployment_id String 模型的deployment_id信息 最小长度:1 最大长度:128 vector_config VectorConfig object 向量模型的相关配置 nlp_config NlpConfig object NLP大模型相关配置
通常在调用API的鉴权过程中,您需要用到账号、用户和密码等信息。 区域 指云资源所在的物理位置,同一区域内可用区间内网互通,不同区域间内网不互通。通过在不同地区创建云资源,可以将应用程序设计的更接近特定客户的要求,或满足不同地区的法律或其他要求。
否 map<string, object> 扩展请求头 deployment_id 否 String 模型的deployment_id信息 最小长度:1 最大长度:128 vector_config 否 VectorConfig object 向量模型的相关配置 nlp_config
文本精排模型 可更加精准找到相关文本,不同于向量模型输出向量,直接计算query和doc的相关性更加准确,可用于对向量召回结果的重新排序。 GuassDB向量数据库 基于Elasticsearch的华为云自研向量检索引擎。
否 map<string, object> 扩展请求头 deployment_id 否 String 模型的deployment_id信息 最小长度:1 最大长度:128 vector_config 否 VectorConfig object 向量模型的相关配置 nlp_config
模型描述 模型详细信息的描述。 昇腾云模型名称 来源于MaaS服务的模型服务的“调用模型名称”,获取方式请参见步骤1:在MaaS部署模型服务。 上下文长度(K) NLP大模型在进行一次特定的推理时可以考虑的最大令牌数。可以扩展上下文以生成更全面的响应。
Token的有效期为24小时,需要使用同一个Token鉴权时,可以缓存起来,避免频繁调用。 Token在计算机系统中代表令牌(临时)的意思,拥有Token就代表拥有某种权限。Token认证就是在调用API的时候将Token加到请求消息头,从而通过身份认证,获得操作API的权限。
父主题: 用户的文档解析规则定义
父主题: 用户的文档解析规则定义
缓存策略 answer_reference_enabled Boolean 是否开启引用 answer_image_reference_enabled Boolean 是否开启图文并茂 extend_config KnowledgeRepoExtendConfig object 知识库扩展配置
用户的文档解析规则定义 创建用户解析规则 修改用户解析规则 列举用户规则列表 删除用户定义规则解析接口
answer_reference_enabled 否 Boolean 是否开启引用 answer_image_reference_enabled 否 Boolean 是否开启图文并茂 extend_config 否 KnowledgeRepoExtendConfig object 知识库扩展配置
缓存策略 answer_reference_enabled Boolean 是否开启引用 answer_image_reference_enabled Boolean 是否开启图文并茂 extend_config KnowledgeRepoExtendConfig object 知识库扩展配置
提供更广泛的上下文,以生成完整回答。 缺省值:false effective_input_length 否 Integer 效果最好的上下文长度,与模型相关,确保输入令牌的有效长度以保证最佳输出 考虑到多轮对话,建议控制在模型上下文长度的60%(向上取整)。
发布环境 选择一个发布策略,通过策略的方式,为API提供灵活的控制策略和扩展能力。 分组 选择一个分组,API分组相当于API的集合,API提供者以API分组为单位,管理分组内的所有API。 说明: API分组发布后不可修改,请谨慎选择。
扩展长上下文: 如果打开了此参数,模型在解析过程中会扩展长上下文以生成更全面结果。 有效输入长度(K):如果打开“扩展长上下文”按钮,则需要设置有效输入长度,输入令牌的有效长度以保证最佳输出。 进入高级设置页面,设置好后,单击“确定”。 引用定位:针对回答结果定位到原文位置。
创建用户解析规则 功能介绍 用于创建用户自定义的解析规则,解析规则用于解析需要作为subtitle的文本,规则由上而下依次校验。
语言任务类:请创作一封约460字的邮件,主题是咨询一个新的IT项目的细节,这个邮件将被发送给公司的IT项目经理。 人设类:你叫什么名字? 通用知识类:豆汁和豆浆的区别。 行业知识类: 对于行业知识类,建议使用前缀匹配,后续可能继续扩展。
下载上传失败的FAQ 功能介绍 下载给定上传的批量FAQ文件中,上传失败的条目。