检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
说明 模型服务调用ID 是 需要调用的大模型。 对于资产中心预置的模型,在资产中心选择“大模型”页签,单击模型卡片进入模型详情页面,查看模型服务调用ID。 对于我的模型(我部署的、我接入的)和我的路由策略,需要填写模型服务调用ID,请单击“获取模型服务调用ID”,进入“我的模型服务”页面,在模型服务列表中单击复制。
按需计费是一种先使用再付费的计费模式,适用于无需任何预付款或长期承诺的用户。本文将介绍按需计费资源的计费规则。 适用场景 按需计费适用于资源需求波动的场景,在使用AppStage的用户创建应用、测试模型服务时需要调用ChatGLM3-6B大模型服务API在线调用、大模型微调服务API在线
一个完整的异常检查任务,自动创建训练数据表,并且参数均为默认参数。 图3 任务状态 任务配置完成后该任务会显示在任务列表,单击任务所在行“操作”列的“基础”,单击“字段配置”,参考表5修改基础数据,获取维度值。 参考步骤四:配置训练模型配置异常检测算法模型,并进行模型训练。 训练
动态阈值会通过训练历史数据,实现对数据特征的学习,构建数据的模型。并利用模型来预测数据的趋势走向。如图2黄色部分,实际值和预测值相差过大,认为异常。 图2 动态阈值 异常检测的能力是基于指标仓库,MPPDB数据库及异常检测服务所构建的。指标仓库定义了数据的来源和数据的计算方式。MP
AI原生应用引擎计费项 计费说明 AI原生应用引擎根据购买的套餐包计费或按需计费。具体内容如表1所示。 表1 AI原生应用引擎计费项说明 计费项 计费项说明 适用的计费模式 计费公式 ChatGLM3-6B大模型服务API在线调用 根据实际输入和输出tokens总量计费,平台提供算力支持。
平台预置的开源模型 开源模型Qwen系列、deepseek-coder系列等 请参考将已有模型部署为模型服务进行部署,部署后即可进行调测/体验、调用。 开源模型chatglm3-6b 平台提供了对应的模型服务API,但是该模型能力有限,只能作为问答模型,不能作为思考模型,首次使用
功能介绍 该接口用于调用agent前向AI原生应用引擎上传文件,目前仅支持图片格式(jpg、png、jpeg),为上传的文件提供访问路径,后续可以使用该访问路径调用agent对话接口。 调用方法 请参见如何调用API。 URI POST https://aiae.appstage.myhuaweicloud
的模型API(我部署的、我接入的)。 当前向量化模型支持的最大长度为512 token,对应的中文约为512个字,英文与符号约900个字符,请注意分片长度。 模型服务商API使用前需要先设置鉴权,具体操作请参见如何对模型供应商提供的模型服务设置鉴权。 长文本策略 截断模式:如果待
非结构化的数据转化为结构化的向量空间,利用向量库实现高效的信息检索。 GraphRAG:知识图谱RAG,是一种结合了知识图谱和大语言模型的RAG技术。GraphRAG能够处理各种类型的文档,从中提取实体(文档中具体的对象或概念)、关系以及文本内容构建知识图谱(一种结构化的知识表示
查看资产总览 在资产总览页面可以查看当前租户所在的根部门以及租户下二级子部门的资产(Agent、模型、数据集、提示语、工具及知识库)统计数据,并支持通过各资产面板,筛选查看各子部门资产的创建、收藏及订阅数据。 前提条件 需要具备AI原生应用引擎租户运营管理员权限,权限申请操作请参见AppStage组织成员申请权限。
工作流体现的是一个具体的业务场景,通过一系列不同功能节点中的触发事件和执行动作编排而成,AI原生应用引擎通过将传统工具API和大模型编排在一起实现复杂的工作流。工作流可在用户创建Agent时调用,Agent使用过程中,当起始节点触发,后续动作即可自动执行,完成一系列复杂的任务。 创
com”。 基本概念 大模型推理服务 直接调用预置大模型提供API完成推理过程。 私有模型部署 针对已经微调训练好的模型,如需评测此模型效果,或通过应用调用此模型,则需将模型部署为线上服务。 向量知识库 通过引入多种类型和格式的企业知识,将数据转化为向量,并利用高效的存储和索引方式进行查询,实现基于检索增强的大模型能力。
judge长时间处于SUBMIT状态直至失败 问题现象 judge记录一直处于提交未执行SUBMIT状态,直至失败FAIL。 可能原因 后端任务内存溢出,可以在训练日志中的ad-agent日志找到报错java.lang.OutOfMemoryError:Java heap space。
应用指标摸板库生成指标运行失败 问题描述 应用指标摸板库生成指标时,提示运行失败。 处理方法 检查选择的数据源和应用的模型是否匹配。模型对选择的数据是有要求的,数据源和模型之间不匹配,将导致指标运行失败。 父主题: 运营中心
Agent体验是指以对话的形式,对自创建的Agent或平台资产中心预置的AI应用进行体验调测,以发现并解决Agent接口上的问题和错误。 体验我的Agent 在AI原生应用引擎的左侧导航栏选择“Agent编排中心 > 我的Agent”。 选择“我创建的”页签,单击Agent列表“操作”列的“体验”。
单击对话输入框中的,上传.wav、.mp4、.mp3格式文件或图片,可以对上传的音频文件或图片提问。 如果创建Agent时开启了“支持语音输入”开关,您也可以单击对话输入框中的,通过语音输入问题。 如果创建Agent时,使用配置变量的方式实现了记忆能力,在使用Agent时会自动识别对话与变
发布Agent的时候提示套餐校验失败 发布Agent前需要订购智能应用运行时引擎资源,请参靠购买AI原生应用引擎,按照需要购买实例个数以及时长。 父主题: AI原生应用引擎
在“平台资产”区域,可查看下述信息数据: Agent数据 模型数据 数据集数据 提示语数据 3 我的空间 在“我的空间”区域,可查看下述信息数据: Agent:当前账号创建的、收藏的、订阅的Agent个数。 模型:当前账号部署的、收藏的、接入的模型个数。 数据集:当前账号创建的微调数据集个数、知识数据集个数。
收藏上架的工具 其他租户或资源相互隔离的部门,如需使用资产中心上架的工具,需要先收藏到“我的工具”列表中,方可便捷地进行使用。 前提条件 需要具备AI原生应用引擎管理员或开发者权限,权限申请操作请参见AppStage组织成员申请权限。 收藏其他租户上架的工具 在AI原生应用引擎的左侧导航栏选择“资产中心”。
单击“打开编辑器”,手动增加一个空的维度值,单击“Save”。 单击维度“列名”后的减号,删掉新增的空维度,单击“确认”。 在异常检测任务模型配置的“算法配置”页面,查看“输出表名”改为新的系统自动创建的输出表。 在异常检测任务模型配置的“训练配置”页面,单击“立即训练”。 父主题: 异常检测Judge定时任务失败