检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
发布Agent的时候提示套餐校验失败 发布Agent前需要订购智能应用运行时引擎资源,请参靠购买AI原生应用引擎,按照需要购买实例个数以及时长。 父主题: AI原生应用引擎
收藏上架的工具 其他租户或资源相互隔离的部门,如需使用资产中心上架的工具,需要先收藏到“我的工具”列表中,方可便捷地进行使用。 前提条件 需要具备AI原生应用引擎管理员或开发者权限,权限申请操作请参见AppStage组织成员申请权限。 收藏其他租户上架的工具 在AI原生应用引擎的左侧导航栏选择
管理我的凭证 创建AK/SK访问密钥 创建API Key
管理工具 创建工具 导入工具 将创建的工具上架到资产中心 收藏上架的工具 调用资产中心工具前设置认证鉴权
管理Agent Agent编排使用指引 创建并发布Agent 体验Agent 使用Agent 收藏资产中心预置的AI应用
管理账号信息 在账号信息页面,用户可以便捷地查看当前登录账号的账户信息(账号名、岗位),以及修改账号密码。为保障账号安全,建议定期更新密码。 查看账户信息 登录AI原生应用引擎,将鼠标移至右上角登录的用户名,弹出“账户信息”页面,可查看当前登录用户的账户信息:账号名、岗位。 修改成员账号密码
管理提示语 创建提示语 对创建的提示语进行优化 管理资产中心预置提示语
TypeError("Cannot index by location index with a non-integer key") 问题现象 在judge日志中出现TypeError("Cannot index by location index with a non-integer
生成模型服务 将已有模型部署为模型服务 接入模型服务 创建路由策略用于提供模型服务 父主题: 管理模型
构建知识库 创建知识数据集 创建知识库 创建知识检索流
如何获取Agent发布时要所需的API Key? 填写AI原生应用引擎平台的API Key,生成方式请参见新增平台API Key。 父主题: AI原生应用引擎
创建工作流 工作流体现的是一个具体的业务场景,通过一系列不同功能节点中的触发事件和执行动作编排而成,AI原生应用引擎通过将传统工具API和大模型编排在一起实现复杂的工作流。工作流可在用户创建Agent时调用,Agent使用过程中,当起始节点触发,后续动作即可自动执行,完成一系列复杂的任务
管理工作流 创建工作流 工作流基础节点说明 工作流工具节点说明
查看模型调用记录 用户可以通过查看模型的调用记录,获取模型调用方式、用时及调用时间等信息。 查看模型调用记录 在AI原生应用引擎的左侧导航栏选择“模型中心 > 模型调用记录”。 在“模型调用记录”页面,通过筛选调用方式、时间范围、状态,或输入模型名称可快速查看模型调用记录信息,如模型调用唯一
快速开始 下载AI原生应用引擎SDK AI原生应用引擎SDK获取地址:wiseagent-dev-sdk-python。您也可以参考下载SDK获取AI原生应用引擎SDK并进行完整性校验。 AI原生应用引擎SDK获取方法请参考。 安装AI原生应用引擎SDK 若已经安装过最新版本SDK
开源模型怎么部署? 开源模型的部署需要购买推理单元,具体操作如下: 在AI原生应用引擎的左侧导航栏选择“资产中心”,选择“大模型”页签。 将鼠标光标移至待部署的开源模型卡片上,单击“部署”。 在“创建部署服务”页面,可以查看到需要几个推理单元,单击“购买推理单元资源”。 图1 创建部署服务
模型使用指引 操作指引 图1 模型使用操作指引 表1 模型使用流程详解 序号 流程环节 说明 1 基于微调数据集进行模型微调 创建微调数据集 收藏预置微调数据集 对于需要个性化定制模型或者在特定任务上追求更高性能表现的场景,往往需要对大语言模型进行模型微调以适应特定任务。微调数据集是模型微调的基础
按照标题切分的时候,分段长度是什么意思? 如果当前分片长度小于该值,则会和其他分片进行合并直到接近该值,所以如果不想合并,请将分段长度设置为1。 父主题: AI原生应用引擎
将已有模型部署为模型服务 模型需要部署成功后才可正式提供模型服务。部署成功后,可以对模型服务进行模型调测,并支持在创建Agent时使用或通过模型调用接口调用。 本文介绍如何将微调后的模型或部分平台资产中心的模型部署为模型服务。 前提条件 已购买推理单元资源,具体购买方法请参见购买AI
模型API接入接口规范 当前模型网关支持文本对话(Chat)、文本向量化(Embeddings)、文本排序(Rerank)三种类型的API接入。模型API接入之前,请确保符合相对应的接口规范,其中Chat接口和Embeddings接口需要符合OpenAI接口规范,Rerank接口需要符合