检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
check and try again later! 很抱歉,模型服务不存在,请检查您输入的模型服务名称! 很抱歉,模型服务不存在,请检查您输入的模型服务名称! 408 AIAE.31001003 Connection timeout, please try again later! 很抱歉,网络连接超时,请稍后重试!
工作流中工具节点的实例如何配置? 工具节点实例需要填写工具创建时所配置的鉴权信息。 三方厂商的工具API,请到工具对应官网获取鉴权信息。 自创建工具请填写工具创建时所配置的鉴权信息。 如果调用其他租户或资源相互隔离的部门所上架的工具,请在AI原生应用引擎中,选择左侧导航栏的“资产
如何通过调用Agent API将变量传递到工作流? 创建Agent时配置变量,如图1所示,具体操作请参见创建并发布Agent。 图1 配置变量 在配置工作流时,选择引入变量,根据Agent中定义的变量类型(一般变量或敏感变量)来设置工作流的入参,如图2所示,具体操作请参见创建工作流。
构造请求 本节介绍REST API请求的组成,并以调用AppStage服务的文本对话接口说明如何调用API。 您还可以通过这个视频教程了解如何构造请求调用API:https://bbs.huaweicloud.com/videos/102987 。 请求URI 请求URI由如下部分组成。
Agent调用统计页面展示当前租户所在的根部门以及租户下二级子部门的Agent调用情况。 前提条件 需要具备AI原生应用引擎租户运营管理员权限,权限申请操作请参见AppStage组织成员申请权限。 查看模型调用统计 在AI原生应用引擎的左侧导航栏选择“运营看板 > Agent调用统计”。 在Agent调用
执行检索规划所调用的模型。 对于资产中心预置的模型,在资产中心选择“大模型”页签,单击模型卡片进入模型详情页面,查看模型服务调用ID。 对于我的模型(我部署的、我接入的)和我的路由策略,需要填写模型服务调用ID,请单击“获取模型服务调用ID”,进入“我的模型服务”页面,在模型服务列表中单击复制。
),从而增强大语言模型对复杂信息的理解和推理能力。 向量化配置 向量化模型 向量化模型是将文本数据转换为数值向量的过程。常用于将文本转换为机器可以处理的形式,以便进行各种任务,如文本分类、情感分析、机器翻译等。 支持选择模型服务商API、预置模型API、我的模型API(我部署的、我接入的)。
图1 AI原生应用引擎使用流程 表1 编排Agent的流程详解 序号 流程环节 说明 1 创建及发布Agent 一站式创建专属Agent,并将应用程序及相关组件进行发布,使其能够正常运行。当前支持创建LLM模式和工作流模式两种类型的Agent。 LLM模式下,将准备好的模型服务(
模型中心是集中管理用户微调后的模型、模型微调流水线(即模型微调任务),以及调测模型。 支持区域: 华北-北京四 创建及管理模型 创建模型微调流水线 调测模型 查看模型调用记录 知识中心 数据是模型训练(含数据标注)以及知识库的基础,在整个模型、知识库中起着至关重要的作用。平台提供统一的数据管理
用于设置当前分段开头与上一个分段结尾重叠部分的长度。 索引配置 向量化模型 选择向量化模型,向量化模型可以将文本数据转换为数值向量,常用于将文本转换为机器可以处理的形式,以便进行各种任务,如文本分类、情感分析、机器翻译等。 当前模型仅支持向量化512 token的内容,对应的中文约为512个
Code代码节点的输入输出参数如何与其他节点进行交互和传递? 输入:按照函数定义中指定的参数列表配置入参,即传递给函数的实际值。支持输入参数或选择前序节点的输出作为输入。 图1 Code代码节点输入 输出:Python代码的函数中定义的每个变量都可在后置节点中引用。 图2 Code代码节点输出
数为0的保护,修复异常,清理元数据,补数据后重新训练。 操作步骤 在“运维数据开发 > 数据开发 > 数据治理 > 指标仓库”中,将创建的指标数据“保护NAN”配置为“是”,并设置NAN时结果值。 快速配置方式创建的告警需要在“AI辅助诊断 > 任务配置 > 异常检测 > 汇聚任
HttpxClient 实例化 表1 实例化参数 参数名 参数类型 是否必选 参数描述 base_url str False 模型网关开放的ip和端口,有默认值可以不填。功能类似OpenAI的base_url。 custom_hearders dict False 其他自定义请求头信息。 http_client
配置管理 本章介绍如何通过IaC代码描述配置信息,支持私有配置和公共配置两种类型。 IaC3.0公共配置集模型与私有配置项绝大部分字段参数一样,具体请参见表1。 表1 配置管理字段说明 参数 是否必选 类型 说明 格式校验 name 是 string 配置集名称 私有配置集:服务环境下name唯一。
如何在工作流中定制逻辑实现特定任务,比如时间格式转换、数组对象的push等 工作流提供了Code代码节点,通过Code代码节点可以在工作流中编写Python代码,根据具体需求定制逻辑以实现特定的任务,如图1所示,具体介绍请参见Code代码。 图1 Code代码节点配置 时间格式转换代码示例:
可购买的实例包数量为1~100个。 推理单元包周期 将基础或者预训练后的模型部署为在线服务时使用的算力单元,通过购买推理单元实现服务QPS扩容。 实例数 可购买的实例数量为1~50个。 AI原生应用引擎基础版 支持知识库容量,智能应用运行时引擎,开通ChatGLM3-6B服务、大模型调优服务API在线调用。 套餐
确保先进性和生命力。 AI原生应用开发 痛点 管好大模型难:大模型百花齐放,能力各异,管好大模型难,为应用场景选择表现最佳模型难。 用好大模型难:在企业的复杂场景中,基础大模型效果不佳,且多个大模型结合缺乏有效手段。 获取高质量数据难:高质量数据决定AIGC的高度,企业缺少准备契合行业和企业的高质量数据集的能力。
ken长度超过向量化模型的token数,则自动对超长部分进行截断处理)。 SMART_MODE(智能模式:如果分片的token长度超过向量化模型的token数,则知识库向量化失败)。 DEFAULT_MODE(默认模式:如果分片的token长度超过向量化模型的token数,则知识库向量化失败)。
AppStage运营中心概览页介绍 运营中心概览页面分为概览、操作指引两个区域,如图1所示。 图1 概览 概览 概览区域展示指标总数、看板总数、数据接入总数、数据模型总数和卡片总数。并提供操作指引的入口链接。↵ 操作指引 操作指引区域展示指标开发者、运营管理员不同角色拥有的操作权限,并提供操作入口。
结束节点作为整条工作流的输出返回,需配置响应体、状态码、响应头参数。 表1 结束节点参数说明 参数 说明 选择回答模式 由Agent生成回答:Agent绑定了大模型时,由大模型对工作流的输出进行总结,生成自然语言回答。 使用设定内容直接回答(对象或数组类型):该模式仅单Agent工作流模式或工作流选择精确模