检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
知识数据集切片长文本处理方式。 取值范围: 枚举值: TRUNCATE_MODE(截断模式:如果分片的token长度超过向量化模型的token数,则自动对超长部分进行截断处理)。 SMART_MODE(智能模式:如果分片的token长度超过向量化模型的token数,则知识库向量化失败)。
数据集切分方法。 约束限制: 不涉及。 取值范围: 枚举值:AUTO_SLICING(自动切分)、TITLE(标题切分)、SENTENCE(自定义切分)、JSON(Json切分)、XML(XML切分),除自动切分外,其它类型切分需传入对应切分配置。 默认取值: 不涉及。 sentence_slicing_config
下的时间窗口之内,对这个方法的调用都会自动地熔断。 异常比例:当监测时间窗口内资源的请求量>=请求量阈值(默认为5),并且监测时间窗口内异常总数占通过量的比值超过阈值之后,资源进入熔断降级状态,即在接下的时间窗口之内,对这个方法的调用都会自动地返回。 异常数:当资源在监测时间窗口内的异常数目超过阈值之后会进行熔断。
下的时间窗口之内,对这个方法的调用都会自动地熔断。 异常比例:当监测时间窗口内资源的请求量>=请求量阈值(默认为5),并且监测时间窗口内异常总数占通过量的比值超过阈值之后,资源进入熔断降级状态,即在接下的时间窗口之内,对这个方法的调用都会自动地返回。 异常数:当资源在监测时间窗口内的异常数目超过阈值之后会进行熔断。
(支持多选): 行业 适用领域 通用 配置部署模型参数,参数说明如表2所示。 表2 微调的模型部署参数说明 参数名称 参数说明 实例个数 设置模型服务部署的实例个数。 不同的模型部署1个实例需要的推理单元个数不同,比如,ChatGLM3-6B需要2个实例。 不同的模型因为模型参数
RetrievalConfig 参数 是否必选 参数类型 描述 retrieval_modes 是 Array of strings 参数解释: 检索模式,用于设置知识库检索召回时的检索方式。 约束限制: 不涉及。 取值范围: 可传多个值。枚举值:SEMANTIC_RETRIEVAL(使用向量进行文本
标准发布”。 在“标准发布检查结果”列表中,不同类型的版本显示相应的检查项的检查规则、检查结论和检查结果,检查项数据来源于组织管理员在版本活动页面设置的标准发布准入配置,具体操作请参见管理版本标准发布准入配置。 检查项均检查通过后,可以单击“下一步”,进入“标准发布”页面,继续申请标准发布。
标准发布”。 在“标准发布检查结果”列表中,不同类型的版本显示相应的检查项的检查规则、检查结论和检查结果,检查项数据来源于组织管理员在版本活动页面设置的标准发布准入配置。 检查项均检查通过后,可以单击“下一步”,进入“标准发布”页面,继续申请标准发布。 申请标准发布 可由开发人员、测试人员或项目经理提交版本标准发布申请。
其中<processor_name>指定某个算子操作,例如add_fields等。<condition>指定一个可选条件,如果条件存在,则只有在满足条件才执行算子,如果未设置任何条件,则始终执行算子。<parameters>是传递给算子的参数列表。 更复杂的条件处理可以通过使用if-then-else条件表达式
在版本详情页面的“版本持续交付”区域,选择“持续部署发布 > 调测发布”。 在“调测发布”页面单击“创建活动”,在“创建调测发布活动”页面,设置版本名称、备注(可选)。 调测发布的版本名称与标准发布的主版本名称前三段一致,仅需定义第四段编号,且第四段编号不能与标准发布的主版本名称第四段编号相同。
"index_config_id": "d3f28e62-xxxxxxx-a15be0d638a2" } ] } 注意:retrieval_status字段设置知识库是否启用检索,如果启用,则检索前不需要再调用修改知识库召回状态接口启用知识库。 将创建接口响应内容保存起来,该内容为知识库id: {
max_tokens 否 Integer 返回体允许的最大token数。 n 否 Integer 返回体中包含的choices数量,建议默认设置为1,最大限度地降低成本。 最小值:1 最大值:128 缺省值:1 presence_penalty 否 Number 介于-2.0和2.0之间的数字。
"expired_keys": "1281", #单位: | 类型:string | 说明:过期而被自动删除的数据库键数量 "latest_fork_usec": "0", #单位: |