检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
长期持续演进,确保先进性和生命力。 AI原生应用开发 痛点 管好大模型难:大模型百花齐放,能力各异,管好大模型难,为应用场景选择表现最佳模型难。 用好大模型难:在企业的复杂场景中,基础大模型效果不佳,且多个大模型结合缺乏有效手段。 获取高质量数据难:高质量数据决定AIGC的高度,
appstage.myhuaweicloud.com”。 基本概念 大模型推理服务 直接调用预置大模型提供API完成推理过程。 私有模型部署 针对已经微调训练好的模型,如需评测此模型效果,或通过应用调用此模型,则需将模型部署为线上服务。 向量知识库 通过引入多种类型和格式的企业知识,将
),从而增强大语言模型对复杂信息的理解和推理能力。 向量化配置 向量化模型 向量化模型是将文本数据转换为数值向量的过程。常用于将文本转换为机器可以处理的形式,以便进行各种任务,如文本分类、情感分析、机器翻译等。 支持选择模型服务商API、预置模型API、我的模型API(我部署的、我接入的)。
该平台面向企业的研发/技术人员,提供企业专属大模型开发和应用开发的整套工具链,包括数据准备、模型选择/调优、知识工程、模型编排、应用部署、应用集成等能力,降低智能应用开发门槛、提升开发效率。AI原生应用引擎助力企业客户将专属大模型能力融入自己的业务应用链路或对外应用服务中,实现
千tokens * 每千tokens单价 推理单元 将基础或者预训练后的模型部署为在线服务时使用的算力单元,通过购买推理单元实现服务QPS扩容。 包年/包月 包年/包月:实例数量*实例单价*购买时长 大模型调用 大模型调用次数。 包年/包月:与“应用并发用户数”一起构成套餐包。 按小、中、大规格计费。
集进行模型训练、知识库构建等,快速完成平台使用并验证模型训练效果。 模型管理 用户可以自定义创建模型、模型服务及在线测试模型,检验模型的准确性、可靠性及反应效果。 提示语管理 用户自定义创建的、收藏的以及平台预置的提示语模板进行优化和改进。 大模型微调 提供调整大型语言模型的参数
运营中心:运营中心专业版、运营中心看板增量包、运营中心指标增量包-10个指标、运营中心指标增量包-100个指标 预置模型服务调用 API SaaS:ChatGLM3-6B大模型服务API在线调用 自定义模型训练 API SaaS:大模型微调服务API在线调用-SFT局部调优 说明: 按需仅适用于AppStage的AI原生应用引擎。
任务配置完成后该任务会显示在任务列表,单击任务所在行“操作”列的“基础”,单击“字段配置”,参考表5修改基础数据,获取维度值。 参考步骤四:配置训练模型配置异常检测算法模型,并进行模型训练。 训练的汇聚任务可以选择左侧导航栏“AI辅助诊断 > 任务配置”,选择“异常检测 > 汇聚任务管理”查看。 父主题:
客户打通自己的业务能力API,将大模型的能力结合进入自己的业务链路。 提供支撑AI原生应用运行的整套模型工具链,包括数据管理、模型接入、模型调优、知识工程等能力,帮助客户选好、管好、用好大模型,从而提升大模型应用效果。 统一主数据平台和概念模型,管理应用生命周期中组织、产品、服务
运营中心 应用数据接入一次性任务运行失败 应用数据接入周期性任务运行失败 AK/SK填写错误 数据模型修改或者删除失败 新建模型失败 应用指标摸板库生成指标运行失败
使用AI原生应用引擎完成大模型调优并测试效果 05 开发 介绍如何开发业务代码以及IaC部署代码。 开发指南 使用Spring Cloud框架实现应用开发 应用平台IaC部署代码开发 06 API 通过AppStage的AI原生应用引擎开放的API和调用示例,您可以使用并管理模型服务、知识库等。
API概览 AppStage接口的分类与说明如表1所示。 表1 API概览 类型 说明 模型调用 包含文本对话类、文本向量化类模型服务调用接口。 应用中心 包含Agent调用、用户配置(工作流、技能)调用、文件盒子等接口。 知识中心 包含知识库和知识数据集的创建、删除、执行及查询等接口。
支持知识库容量,智能应用运行时引擎,开通ChatGLM3-6B服务、大模型调优服务API在线调用。 套餐包单价+按需计费(ChatGLM3-6B服务、大模型调优服务API在线调用) 知识库容量:50GB 智能应用运行时引擎(20实例):2个 ChatGLM3-6B服务、大模型调优服务API在线调用根据实际输入和输
则发生异常。如图1黄色部分 超过阈值线3,则数据异常。 图1 固定阈值 动态阈值会通过训练历史数据,实现对数据特征的学习,构建数据的模型。并利用模型来预测数据的趋势走向。如图2黄色部分,实际值和预测值相差过大,认为异常。 图2 动态阈值 异常检测的能力是基于指标仓库,MPPDB数
AI原生应用引擎管理员角色,可以查看工作空间、资产中心,可以管理我的模型、数据集与知识库、我的提示语,还可以创建访问密钥。 AI原生应用引擎开发者 AI原生应用引擎浏览者 组织管理员 AI原生应用引擎开发者 服务级 AI原生应用引擎开发者角色,可以查看工作空间、资产中心,可以管理我的模型、数据集与知识库、我的提示语,还可以创建访问密钥。
冻结”,您将无法对处于保留期的按需计费资源执行任何操作。 保留期到期后,如果您仍未支付账户欠款,那么ChatGLM3-6B大模型服务API在线调用、大模型微调服务API在线调用-SFT局部调优将无法再使用。 图1 按需计费AI原生应用引擎资源生命周期 华为云根据客户等级定义了不同客户的宽限期和保留期时长。
击“Save”。 单击维度“列名”后的减号,删掉新增的空维度,单击“确认”。 在异常检测任务模型配置的“算法配置”页面,查看“输出表名”改为新的系统自动创建的输出表。 在异常检测任务模型配置的“训练配置”页面,单击“立即训练”。 父主题: 异常检测Judge定时任务失败
用于设置当前分段开头与上一个分段结尾重叠部分的长度。 索引配置 向量化模型 选择向量化模型,向量化模型可以将文本数据转换为数值向量,常用于将文本转换为机器可以处理的形式,以便进行各种任务,如文本分类、情感分析、机器翻译等。 当前模型仅支持向量化512 token的内容,对应的中文约为512个
创建LLM模式和工作流模式两种类型的Agent。 LLM模式下,将准备好的模型服务(必选)、工具、工作流及知识库等编排成Agent。 工作流模式下,用户与工作流进行对话,因此必须添加工作流,不支持添加模型、工具、知识库等配置。 2 体验Agent 以对话的形式,对创建的Agent
API 模型调用 应用中心 知识中心