检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
tus 表1 路径参数 参数 是否必选 参数类型 描述 knowledge_base_id 是 String 参数解释: 知识库id。获取方式: 1.从创建知识库接口返回获取。 2.进入AI原生应用引擎,在左侧导航栏选择“知识中心 > 知识库”,可从页面知识库id栏获取。 约束限制:
选择配置类型,即创建日志采集配置时选择的配置类型,根据配置类型会过滤采集配置列表中的数据。 采集配置列表 选择需要下发的配置。 步骤五:安装日志采集插件 在“日志接入”页面,选择左侧导航栏的“集群插件管理”。 在集群列表中单击待安装插件的集群所在行“操作”列的“安装插件”。 在“插件安装”
通过调测模型,可检验模型的准确性、可靠性及反应效果,发现模型中存在的问题和局限性,确保模型能够在实际应用中正常运行,并且能够准确地预测和处理数据。 支持对我的模型(我部署的、我接入的)、我的路由策略、平台预置的模型以及平台接入的第三方模型进行调测。 前提条件 调测平台接入的第三方模型前,需
执行知识数据集 功能介绍 该接口用于根据知识数据集id,触发知识数据集的调度执行,调度执行完毕,数据集的内容将被更新。该接口仅在数据来源为OBS接入有效。 调用方法 请参见如何调用API。 URI POST https://aiae.appstage.myhuaweicloud.
要先将选定的API服务注册为一个工具,然后再添加该服务下的API作为工具的执行动作。具体介绍请参见创建工具。 在工作流中首次调用我的工具类的节点需要新增实例,实例是工具的鉴权方式,如果未新增实例,工具就无法调通。 在工具类节点配置时,单击“新增实例”,此处以“历史上的今天”节点配置为例,如图1所示。
插件安装会占用集群资源,可以根据业务日志量,调整container的requests大小,来控制集群的资源占用量,具体操作请参见如何调整纳管集群的资源占用量。 输入日志挂载路径:挂载到容器指定挂载点中的容器所在宿主机的文件目录,通常为宿主机上日志文件的hostpath目录。需要设置为单独的文件路径,不能设置为类似于/
解决:使用正确的密码。 原因2:如果用的是cloud+stsl连的高斯数据库,原因是没有STS的调用步骤。 通过搜索rainbow日志关键字:Password is Empty! 解决:正确调用STS。 原因3:本地连接报这个错。 解决: 先把配置信息删除,给Schema创建新的业务账号,新增配置信息。
单击实例列表的所属ERS集群列,跳转到工作负载列表页面。 配置POD实例伸缩 在实例列表上方配置目标实例数,单击“保存”,在弹出的提示框中单击“确定”,即可进行实例扩缩容。 说明: 灰度期间,如果配置并打开了水平自动伸缩(HPA),则扩缩容的目标实例数需要介于HPA的[minReplicas
查看工作负载列表 单击实例列表的所属ERS集群列,跳转到工作负载列表页面。 配置POD实例伸缩 在实例列表上方配置目标实例数,单击“保存”,在弹出的提示框中单击“确定”,即可进行实例扩缩容。 灰度期间,如果配置并打开了水平自动伸缩(HPA),则扩缩容的目标实例数需要介于HPA的[minReplicas
单击标注右侧“删除”,可删除标注。 对于标注中的output,还可执行以下操作: 单击output所在行右侧的“自动生成”,由平台内置的模型自动生成当前行的output信息。 单击output所在行右侧的“重新生成”,由平台内置的模型重新生成当前行的output信息。 单击output所在行右侧的“删除”,可删除当前行的output信息。
流程是通过使用事件自动化平台(Event & Action Platform,EAP)所提供的运维中心各个子系统的系统动作,组合编排来解决复杂运维场景,如需查看当前已上架的EAP动作,请参见查看已上架的EAP动作,可以了解已上架动作类型、作用、输入和输出参数。本章节介绍如何创建及执行流程。
您还可以对已安装的插件进行以下操作。 表3 插件管理操作 操作名称 操作步骤 升级插件 在插件列表,单击待升级的插件所在行“操作”列的“升级”。 回滚插件 在插件列表,单击待回滚的插件所在行“操作”列的“回滚”。 删除插件 在插件列表,单击待删除的插件所在行“操作”列的“删除”。 导出资源内容
AppStage运营中心使用流程 按照不同的使用场景,运营中心使用流程如图1所示。 图1 使用流程 使用场景一:数据工程师/分析师支撑或配合业务提出的数据相关需求,完成一些相对复杂的数据接入、数据建模以及数据指标开发的工作。 接入运营数据:运营中心提供通用数据接入能力,通过与数据
data_set_id 是 String 参数解释: 知识数据集id,获取方式: 1.创建知识数据集接口返回值即为知识数据集id。 2.进入AI原生应用引擎,在左侧导航栏选择“知识中心 > 知识库”,选择页面右上角的“... > 知识数据集”,在数据集列表中,单击数据集名称,进入详情页即可获取数据集id。
参数解释: 知识数据集切片长文本处理方式。 约束限制: 不涉及。 取值范围: 枚举值: TRUNCATE_MODE(如果分片的token长度超过向量化模型的token数,则知识库向量化失败)。 SMART_MODE(如果分片的token长度超过向量化模型的token数,则自动对超长部分进行截断处理)。
基本概念 说明 产品 产品是服务的合集,开发中心基于服务进行版本管理。 服务 服务是实现一系列功能的软件模块单元,是产品的组成要素,一个产品一般由一个或多个服务组成。将一个大型的应用程序可以拆分成一组小型、独立的服务。每个服务都运行在自己的进程中,并通过轻量级的通信机制(如HTTP或消息
模型服务调用ID 是 需要调用的大模型。 对于资产中心预置的模型,在资产中心选择“大模型”页签,单击模型卡片进入模型详情页面,查看模型服务调用ID。 对于我的模型(我部署的、我接入的)和我的路由策略,需要填写模型服务调用ID,请单击“获取模型服务调用ID”,进入“我的模型服务”页面,在模型服务列表中单击复制。
按需计费AI原生应用引擎资源生命周期 欠费预警 系统会在每个计费周期后的一段时间对按需计费资源进行扣费。当您的账户被扣为负值时,我们将通过邮件、短信和站内信的方式通知到华为云账号的创建者。 欠费后影响 当您的账号因按需自动扣费导致欠费后,账号将变成欠费状态。欠费后,按需资源不会立
大语言模型的回答,大语言模型完整生成回答后一次性返回。 流式:调用大语言模型推理服务时,根据用户问题,获取大语言模型的回答,逐个字词的快速返回模式,不需等待大语言模型生成完成。 输出最大token数 表示模型输出的最大长度。 温度 较高的数值会使输出更加随机,而较低的数值会使其更
纳堡垒机参数说明 参数名称 参数说明 部门 选择需要纳管的部门,可选部门为在业务控制台已创建的部门。 产品 选择需要纳管的产品,可选产品为在业务控制台已创建的产品。 服务 选择需要纳管的服务,可选服务为在业务控制台已创建的服务。 环境 选择环境,为服务下的环境绑定堡垒机。 一个环境只能绑定一个堡