检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
取值范围: 可以为空,为空则使用默认值。枚举值:VECTOR_RAG(向量RAG,是一种结合了向量化和大语言模型的RAG技术)、GRAPH_RAG(知识图谱RAG,是一种结合了知识图谱和大语言模型的RAG技术)。 默认取值: VECTOR_RAG。 retrieval_config 否 RetrievalConfig
通过StsAgent加密后,手工配置: 检查加密的时候使用的服务级别servicekek还是微服务级别kek,和密文中的级别是否一致,服务名和微服务名是否和该运行的微服务一致?加密得到密文的STS环境和运行的STS环境是否一致?例如测试环境加密的密文是不能在生产环境解密。 # 使用微服务kek加密
该参数接受一个JSON对象,将标记映射到从-100(禁止)到100(独占选择标记)的关联偏差值。 像-1和1这样的适度值将以较小的程度改变选择标记的概率。 使用logit_bias参数时,偏差被添加到模型生成的logits之前进行抽样。 约束限制: 不涉及。 取值范围: 不涉及。 默认取值:
引擎自动按照名称进行分配,并完成检索流的调用。 具体结构请参照本接口的请求实例。 约束限制: 不涉及 响应参数 状态码: 200 表4 响应Body参数 参数 参数类型 描述 responseBody String 参数解释: 流执行结果的内容。 取值范围: 不涉及。 responseHeaders
执行知识库 功能介绍 该接口用于执行知识库,将知识数据集的更新同步到知识库中。 调用方法 请参见如何调用API。 URI POST https://aiae.appstage.myhuaweicloud.com/v1/knowledge-bases/{knowledge_base_id}/execute
相关操作 在“权限管理”页面,支持的其他操作请参考表1。 表1 相关操作 操作 步骤 查看我的权限 在“我的权限”页面,列表中展示登录用户的权限。 延期权限 在“我的权限”页面,勾选需要延期的权限,单击“延期权限”。 取消权限 在“我的权限”页面,勾选需要取消的权限,单击“取消权限”。 查看权限申请信息
单击,选择“微服务开发 > 负载均衡”。 选择左侧导航栏的“监听管理”。 单击待同步监听操作列的“同步”。 您也可以单击待同步监听的名称,在监听详情页面,选择“SLB实例”页签,执行同步。 单击SLB节点列表操作列的“同步”,将监听配置同步到相应的SLB节点。 单击“全量同步”,将监听配置同步到SLB所有节点。
包、SQL包等进行集中管理,用于升级变更服务的虚拟机。软件仓库不同软件包的说明如表1所示。 同时支持将镜像仓SWR(SoftWare Repository for Container)进行统一管理,可以绑定使用镜像仓中的镜像用于服务的容器升级变更,具体操作请参见录入并绑定华为云镜像仓SWR。
相关操作 在“权限管理”页面,支持的其他操作请参考表1。 表1 相关操作 操作 步骤 查看我的权限 在“我的权限”页面,列表中展示登录用户的权限。 延期权限 在“我的权限”页面,勾选需要延期的权限,单击“延期权限”。 取消权限 在“我的权限”页面,勾选需要取消的权限,单击“取消权限”。 查看权限申请信息
创建API Key API Key是每个用户单独的身份认证,是个人调用应用接口的依据,必须妥善保管。用户开发的Agent在调用平台接口时需要进行平台鉴权认证,可以使用“平台API Key”进行平台的鉴权认证。 前提条件 需要具备AI原生应用引擎管理员或开发者权限,权限申请操作请参见AppStage组织成员申请权限。
引擎自动按照名称进行分配,并完成工作流的调用。 具体结构请参照本接口的请求实例。 约束限制: 不涉及。 响应参数 状态码: 200 表4 响应Body参数 参数 参数类型 描述 responseBody String 参数解释: 流执行结果的内容。 取值范围: 不涉及。 responseHeaders
在“已导入资源”中,可以看到之前导入的但尚未被组件纳管的资源,可以勾选需要导入的资源,单击“导入”。 查看未纳管资源 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 部署服务”。 选择左侧导航栏的“环境管理 > 服务环境管理”。 在环境列表中单击待查看未纳管资源的环境所在行“操作”列的“更多
登录AI原生应用引擎,在左侧导航栏选择“模型中心 > 我的模型服务”,选择“我部署的”页签,在模型服务列表中复制模型服务调用ID。 3.租户接入模型服务 登录AI原生应用引擎,在左侧导航栏选择“模型中心 > 我的模型服务”,选择“我接入的”页签,在模型服务列表中复制模型服务调用ID。 约束限制:
在顶部导航栏选择服务。 单击,选择“运维 > 主机管理服务(VMS)”。 选择左侧导航栏的“云服务器管理”,根据实际情况选择主机类型“弹性云服务器”、“裸金属服务器”或“边缘云服务器”。 在主机列表勾选需要重置的主机,单击“重置OS”。 在“重置OS”页面,选择重置OS架构类型、镜像名称、
开源模型怎么部署? 开源模型的部署需要购买推理单元,具体操作如下: 在AI原生应用引擎的左侧导航栏选择“资产中心”,选择“大模型”页签。 将鼠标光标移至待部署的开源模型卡片上,单击“部署”。 在“创建部署服务”页面,可以查看到需要几个推理单元,单击“购买推理单元资源”。 图1 创建部署服务
如何卸载虚拟机上安装的filebeat? 使用运维中心监控服务配置虚拟机日志接入时,通过任务下发日志采集配置内容并安装filebeat。当用户不再使用运维中心或不再使用虚拟机时,可以手动卸载虚拟机上安装的filebeat。 前提条件 已获业务主机root账号密码。 操作步骤 使用root账号登录业务主机。
创建AK/SK访问密钥 AK/SK访问密钥是每个用户单独的身份认证,是个人调用应用接口的依据,必须妥善保管。用户创建Agent在调用平台接口时需要进行平台鉴权认证,可以使用“AK/SK访问密钥”进行平台的鉴权认证。 前提条件 需要具备AI原生应用引擎管理员或开发者权限,权限申请操
按需计费AI原生应用引擎资源生命周期 欠费预警 系统会在每个计费周期后的一段时间对按需计费资源进行扣费。当您的账户被扣为负值时,我们将通过邮件、短信和站内信的方式通知到华为云账号的创建者。 欠费后影响 当您的账号因按需自动扣费导致欠费后,账号将变成欠费状态。欠费后,按需资源不会立即停止服务,资源进入宽限
至少包含字母和数字,不能包含空格。 密码强度:勿使用其他账号的密码。 如果您有其他设备使用此账号,设置新密码后需重新登录,以确保正常使用华为服务。 修改个人华为账号的密码 适用于修改个人华为账号(包括购买AppStage的租户开通者的个人华为账号、通过邀请成员加入组织的个人华为账号)的密码。为保障账号安全,建议定期更新密码。
然后再添加该服务下的API作为工具的执行动作。 前提条件 需要具备AI原生应用引擎管理员或开发者权限,权限申请操作请参见AppStage组织成员申请权限。 已获取API服务的连接信息以及调用API所需的访问权限和密钥。 创建工具 在AI原生应用引擎的左侧导航栏选择“Agent编排中心