检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
AI原生应用引擎使用流程 AI原生应用引擎是企业专属的一站式大模型开发及应用构建平台,其核心是将自创建或平台预置的模型服务、工具、工作流及知识库等编排成具有一定智能性和自主性的Agent。本章节梳理了AI原生应用引擎使用流程,可帮助您快速了解AI原生应用引擎的核心功能。 图1 AI原生应用引擎使用流程
基础信息、选择模型及设定角色。 表1 创建Agent参数说明 参数名称 参数说明 基础信息 设置Agent名称、描述信息。 您也可以先输入应用功能描述等信息,单击后智能生成基础信息。 模型选择 方式一:单击,在弹框中设置如下参数,选择思考模型和问答模型。 思考模型用于任务规划和选
据超过上限或是低于下限则发生异常。如图1黄色部分 超过阈值线3,则数据异常。 图1 固定阈值 动态阈值会通过训练历史数据,实现对数据特征的学习,构建数据的模型。并利用模型来预测数据的趋势走向。如图2黄色部分,实际值和预测值相差过大,认为异常。 图2 动态阈值 异常检测的能力是基于
单击输入框右侧的“引用模板”选择我创建的、我收藏的或平台预置的提示语模板。 推理模型 将提示语应用于我创建的、平台预置的或第三方模型服务中,预览推理结果。 选择推理模型后,可配置推理模型的相关参数,如表2所示。 表2 推理模型参数配置说明 参数名称 参数说明 最大token数 影响推理返回内容的最大长度,取值范围:1-10000。
域,Endpoint为“aiae.appstage.myhuaweicloud.com”。 基本概念 大模型推理服务 直接调用预置大模型提供API完成推理过程。 私有模型部署 针对已经微调训练好的模型,如需评测此模型效果,或通过应用调用此模型,则需将模型部署为线上服务。 向量知识库
集进行模型训练、知识库构建等,快速完成平台使用并验证模型训练效果。 模型管理 用户可以自定义创建模型、模型服务及在线测试模型,检验模型的准确性、可靠性及反应效果。 提示语管理 用户自定义创建的、收藏的以及平台预置的提示语模板进行优化和改进。 大模型微调 提供调整大型语言模型的参数
单击输入框右侧的“引用模板”选择我创建的、我收藏的或平台预置的提示语模板。 推理模型 将提示语应用于我创建的、平台预置的或第三方模型服务中,预览推理结果。 选择推理模型后,可配置推理模型的相关参数,如表3所示。 表3 推理模型参数配置说明 参数名称 参数说明 最大token数 影响推理返回内容的最大长度,取值范围:1-10000。
、测试模型服务时需要调用ChatGLM3-6B大模型服务API在线调用、大模型微调服务API在线调用-SFT局部调优,按需计费模式能大幅降低客户的业务成本。 适用计费项 AI原生应用引擎的以下计费项支持按需计费。 表1 适用计费项 计费项 说明 ChatGLM3-6B大模型服务API在线调用
应用指标摸板库生成指标运行失败 问题描述 应用指标摸板库生成指标时,提示运行失败。 处理方法 检查选择的数据源和应用的模型是否匹配。模型对选择的数据是有要求的,数据源和模型之间不匹配,将导致指标运行失败。 父主题: 运营中心
收藏资产中心预置的AI应用 支持收藏平台资产中心预置的AI应用。将自己关注的AI应用收藏后,可便捷地在收藏列表中查看应用详情及体验Agent。 前提条件 需要具备AI原生应用引擎管理员或开发者权限,权限申请操作请参见AppStage组织成员申请权限。 收藏资产中心预置AI应用 在AI原生应用引擎的左侧导航栏选择“资产中心”。
AI原生应用引擎工作空间介绍 进入AI原生应用引擎 登录AppStage。 在快捷入口选择“AI原生应用引擎”,进入AI原生应用引擎。 工作空间介绍 在AI原生应用引擎的左侧导航栏选择“工作空间” ,进入工作空间页面,可获得系统中各资源数据概览及产品的相关快速指引。 工作空间页面
适用计费项 AI原生应用引擎 AI应用服务:问答AI服务基础版、问答AI服务专业版 知识库:知识库容量包(10GB) 智能应用运行时引擎:智能应用运行时引擎(1实例)、智能应用运行时引擎(20实例) 模型部署:推理单元包周期 AI原生应用引擎基础版 AI原生应用引擎专业版 AI原生应用引擎企业版
和推理方向。 大语言模型 大语言模型是一种能够理解和生成人类语言的人工智能模型。这些模型通常使用大量的数据进行训练,以便它们能够识别语言中的模式和规律。大语言模型的应用范围非常广泛,包括自然语言处理、机器翻译、语音识别、智能问答等领域。 向量化模型 向量化模型是将文本数据转换为数
产品运营人员能直观查看关键数据,分析产品运营过程中取得的成效和潜在问题。 数据模型 运营中心提供数据建模能力,运营人员可以新建实时数据模型和离线数据模型,也可以通过逆向数据库生成数据模型。通过提供多表关联建模整合表能力,一个数据模型可以映射多个数据表数据。 指标管理 运营中心提供指标自定义灵活配
告警后触发知识编排任务提示alert_type不存在 如何从ENS找到服务容器绑定的安全组? 更多 运营中心 如何处理应用数据接入一次性任务运行失败? 如何处理应用数据接入周期性任务运行失败? 如何处理AK/SK填写错误? 如何处理数据模型修改或者删除失败? 如何处理新建模型失败? 如何处理指标摸板库生成的指标运行失败?
策略配置”。 单击“统一告警定义”,进入告警定义页面。 单击“创建”。 配置AIOps规则参数,参数说明如表1所示,配置完成后,单击“确定”。 表1 AIOps规则参数说明 参数名称 参数说明 指标来源 选择告警的指标来源“AIOps”。 告警定义名称 自定义告警定义的名称。 级别 选择该规则生成告警的级别。
重排序执行动作参数说明 参数 说明 输入 模型服务调用ID 执行重排序所调用的模型。 对于我收藏的模型及资产中心的模型,请填写模型名称。 对于我的模型(我部署的、我接入的)和我的路由策略,需要填写模型服务调用ID,请单击“获取模型服务调用ID”,进入模型服务列表,单击复制。 原始查询内容
之后,当起始节点的事件发生,后续动作即可自动执行。AI原生应用引擎通过将传统工具API和大模型编排在一起实现复杂的工作流。 在开发过程中,工作流可在用户创建Agent时调用,有效提高Agent开发的效率。 前提条件 需要具备AI原生应用引擎管理员或开发者权限,权限申请操作请参见AppStage组织成员申请权限。
说明 1 创建及发布Agent 将准备好的模型服务、工具、工作流、知识库等编排成Agent应用,并将应用程序及相关组件进行发布,使其能够正常运行。 2 体验Agent Agent体验是指以对话的形式,对创建的Agent或平台资产中心预置的AI应用进行体验调测,以发现并解决Agent接口上的问题和错误。
文、数字开头。 索引描述 索引配置的描述信息。 向量化模型 选择向量化模型,向量化模型是将文本数据转换为数值向量的过程。常用于将文本转换为机器可以处理的形式,以便进行各种任务,如文本分类、情感分析、机器翻译等。 当前向量化模型支持的最大长度为512 token,对应的中文约为51