检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
操作场景 本文通过调用一系列知识中心的API,介绍从零开始创建知识库并进行检索的基本流程。API调用方法请参见如何调用API。 前提条件 准备一篇名为“问题.txt”的文档,文档内容为: “什么是量子计算?它是一种利用量子力学原理进行信息处理的计算方式。==== 什么是RAG?它
使用限制 单账号跟踪的事件可以通过云审计控制台查询。多账号的事件只能在账号自己的事件列表页面去查看,或者到组织追踪器配置的OBS桶中查看,也可以到组织追踪器配置的CTS/system日志流下面去查看。 用户通过云审计控制台只能查询最近7天的操作记录。如果需要查询超过7天的操作记录,您必
部署包 部署包就是ansible-playbook,作为业务虚拟机部署的脚本使用。 图1 部署包结构 其中package.json里面的内容为playbook。 父主题: 打包规范
str False 模型网关开放的IP和端口,有默认值可以不填。功能类似OpenAI的base_url。 custom_hearders dict False 其他自定义请求头信息。 http_client httpx.client False 自定义的httpx client。 kwargs
在“删除在线文档”对话框,单击“确认”,即可删除不需要的在线文档。 通过离线文档方式上传/更新/删除交付件 用户需对自己上传文件的安全风险负责,开发中心不对用户自己上传的文件做任何处理。 在“交付件管理”页面的交付件列表中,在无文档的交付件所在行的“操作”列单击“创建文档”。 在“上传文档”
离线定制的卡片是通过离线脚手架进行开发的,相关开发文档和开发依赖请联系华为工程师进行获取。 卡片分类 必填项。 在下拉框中选择卡片的分类名称。默认显示第一个分类名称。 描述 必填项。 卡片的描述信息。由1~400个字符组成,包含中文、字母、数字及下划线。 卡片封面 可选项。 单击左侧方框中的,上传本地准备好的封面图。推荐图片比例为4:3。
果分片的token长度超过向量化模型的token数,则自动对超长部分进行截断处理)。 SMART_MODE(智能模式:如果分片的token长度超过向量化模型的token数,则知识库向量化失败)。 DEFAULT_MODE(默认模式:如果分片的token长度超过向量化模型的token数,则知识库向量化失败)。
/运营中心/的包年/包月资源。 在“套餐详情”区域,单击“退订”。 退订已购买的按需计费资源,适用于退订AI原生应用引擎的按需计费资源。 在应用平台控制台左侧导航栏选择“AI原生应用引擎”,在AI原生应用引擎详情页面的“我的资源”区域的资源列表中,单击需要停止计费的资源“操作”列的“退订”。
d为申请的令牌ID,password为申请的令牌,添加完成后单击“保存”。 新建页面:选择“新建页面”,可以创建页面或分类,分类是对页面的分组,页面类型说明如表1所示,参数配置完成后单击“确定”。 表1 页面类型说明 页面类型 说明 瀑布流页面 最常用的页面类型,即常见的报表页面。
风险等级及建议的发布阶段。 配置评估参数,单击“开始评估”,系统会根据不同的风险等级评估结果。 单击“下一步”。 在分流配置页面,输入分流规则名称,填写各个阶段的分流配置项,单击“下一步”。分流配置项的参数说明如表1所示。 N阶段发布时,单击“插入新阶段”,插入新的分流阶段;单击分流配置项右上角的,可以删除配置项。
自定义卡片的名称。由1~64个字符组成,包含中文、字母、数字及下划线。 版本 卡片的版本信息,不可修改。 样式分类 卡片的分类,不可修改。 卡片分类 必选项。 在下拉框中选择卡片的分类名称。默认显示第一个分类名称。 描述 必填项。 自定义卡片的描述信息。 封面图 卡片的封面图。
检索模式,用于设置知识库检索召回时的检索方式。 约束限制: 不涉及。 取值范围: 可传多个值。枚举值:SEMANTIC_RETRIEVAL(使用向量进行文本语义查询,即调用向量数据库根据向量的相似性检索),FULL_TEXT_RETRIEVAL(使用关键字进行文本匹配,适合查找一些关键词和主题语的数据)。
风险等级及建议的发布阶段。 配置评估参数,单击“开始评估”,系统会根据不同的风险等级评估结果。 单击“下一步”。 在分流配置页面,输入分流规则名称,填写各个阶段的分流配置项,单击“下一步”。分流配置项的参数说明如表1所示。 N阶段发布时,单击“插入新阶段”,插入新的分流阶段;单击分流配置项右上角的,可以删除配置项。
统还会创建默认的治理账号,默认的治理账号包括monitor账号(监控账号)、dbquery账号(数据查询账号)及change账号(SQL变更账号,随Schema同步创建,一个Schema对应一个change账号)。对于同步上来的原Schema,系统会根据同步上来的Schema创建对应的change账号。
统还会创建默认的治理账号,默认的治理账号包括monitor账号(监控账号)、dbquery账号(数据查询账号)及change账号(SQL变更账号,随Schema同步创建,一个Schema对应一个change账号)。对于同步上来的原Schema,系统会根据同步上来的Schema创建对应的change账号。
对于租户上架的工具,设置鉴权信息弹框中通常会展示工具鉴权获取地址,请根据界面提示进行获取。 鉴权信息与工具创建时所采用的验证方式有关,一般常见的有appkey、X-API-Key等。 对于已设置鉴权的工具,在“设置鉴权信息”对话框,单击“移除”。 移除鉴权信息后将影响该工具的调用,需重新设置才能进行调用。
式系统中的一些常见模式(例如配置管理,服务发现,断路器,智能路由,微代理,控制总线,短期微服务和契约测试)。分布式系统的协调导致了样板模式,使用Spring Cloud,开发人员可以快速构建实现这些模式的服务和应用程序。它们可以在任何分布式环境中工作,包括开发人员自己的笔记本电脑、裸机数据中心和Cloud
str False 模型网关开放的ip和端口,有默认值可以不填。功能类似OpenAI的base_url。 custom_hearders dict False 其他自定义请求头信息。 http_client httpx.client False 自定义的httpx client。 kwargs
str False 模型网关开放的ip和端口,有默认值可以不填。功能类似OpenAI的base_url。 custom_hearders dict False 其他自定义请求头信息。 http_client httpx.client False 自定义的httpx client。 kwargs
开源模型怎么部署? 开源模型的部署需要购买推理单元,具体操作如下: 在AI原生应用引擎的左侧导航栏选择“资产中心”,选择“大模型”页签。 将鼠标光标移至待部署的开源模型卡片上,单击“部署”。 在“创建部署服务”页面,可以查看到需要几个推理单元,单击“购买推理单元资源”。 图1 创建部署服务