检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
500 UniModel.Internal.0001 模型访问失败 无法访问选择的模型 检查模型是否已经正常部署 500 UniModel.Internal.0002 模型返回超时 模型服务返回超时 检查网络情况,或者减少模型返回内容 500 WS.00100001 AUTHENTICATION_ERROR
持客户打通自己的业务能力API,将大模型的能力结合进入自己的业务链路。 提供支撑AI原生应用运行的整套模型工具链,包括数据管理、模型接入、模型调优、知识工程等能力,帮助客户选好、管好、用好大模型,从而提升大模型应用效果。 构建企业应用与大模型之间的安全隔离带,结合华为云安全控制机制,保障AI原生应用安全可信。
千tokens * 每千tokens单价 推理单元 将基础或者预训练后的模型部署为在线服务时使用的算力单元,通过购买推理单元实现服务QPS扩容。 包年/包月 包年/包月:实例数量*实例单价*购买时长 大模型调用 大模型调用次数。 包年/包月:与“应用并发用户数”一起构成套餐包。 按小、中、大规格计费。
配置管理 本章介绍如何通过IaC代码描述配置信息,支持私有配置和公共配置两种类型。 IaC3.0公共配置集模型与私有配置项绝大部分字段参数一样,具体请参见表1。 表1 配置管理字段说明 参数 是否必选 类型 说明 格式校验 name 是 string 配置集名称 私有配置集:服务环境下name唯一。
500 UniModel.Internal.0001 模型访问失败 无法访问选择的模型 检查模型是否已经正常部署 500 UniModel.Internal.0002 模型返回超时 模型服务返回超时 检查网络情况,或者减少模型返回内容 500 WS.00100001 AUTHENTICATION_ERROR
使用AI原生应用引擎完成大模型调优并测试效果 05 开发 介绍如何开发业务代码以及IaC部署代码。 开发指南 使用Spring Cloud框架实现应用开发 应用平台IaC部署代码开发 06 API 通过AppStage的AI原生应用引擎开放的API和调用示例,您可以使用并管理模型服务、知识库等。
appstage.myhuaweicloud.com”。 基本概念 大模型推理服务 直接调用预置大模型提供API完成推理过程。 私有模型部署 针对已经微调训练好的模型,如需评测此模型效果,或通过应用调用此模型,则需将模型部署为线上服务。 向量知识库 通过引入多种类型和格式的企业知识,将
),从而增强大语言模型对复杂信息的理解和推理能力。 向量化配置 向量化模型 向量化模型是将文本数据转换为数值向量的过程。常用于将文本转换为机器可以处理的形式,以便进行各种任务,如文本分类、情感分析、机器翻译等。 支持选择模型服务商API、预置模型API、我的模型API(我部署的、我接入的)。
Req)服务中“Scrum项目”的和“IPD项目”相关需求管理的能力,是华为多年研发实践沉淀的需求管理与团队协作服务,内置多种开箱即用的场景化需求模型。 关于需求管理的常见问题请参见工作项常见问题。 父主题: 开发中心
运营中心:运营中心专业版、运营中心看板增量包、运营中心指标增量包-10个指标、运营中心指标增量包-100个指标 预置模型服务调用 API SaaS:ChatGLM3-6B大模型服务API在线调用 自定义模型训练 API SaaS:大模型微调服务API在线调用-SFT局部调优 说明: 按需仅适用于AppStage的AI原生应用引擎。
需求管理是开发中心集成需求管理(CodeArts Req)服务的能力,是华为多年研发实践沉淀的需求管理与团队协作服务,内置多种开箱即用的场景化需求模型。用户可以创建版本需求,或者为版本关联需求,完成版本需求规划。 本章节介绍如何使用开发中心集成的CodeArts Req服务能力创建并规划
运营中心 应用数据接入一次性任务运行失败 应用数据接入周期性任务运行失败 AK/SK填写错误 数据模型修改或者删除失败 新建模型失败 应用指标摸板库生成指标运行失败
任务配置完成后该任务会显示在任务列表,单击任务所在行“操作”列的“基础”,单击“字段配置”,参考表5修改基础数据,获取维度值。 参考步骤四:配置训练模型配置异常检测算法模型,并进行模型训练。 训练的汇聚任务可以选择左侧导航栏“AI辅助诊断 > 任务配置”,选择“异常检测 > 汇聚任务管理”查看。 父主题:
用于设置当前分段开头与上一个分段结尾重叠部分的长度。 索引配置 向量化模型 选择向量化模型,向量化模型可以将文本数据转换为数值向量,常用于将文本转换为机器可以处理的形式,以便进行各种任务,如文本分类、情感分析、机器翻译等。 当前模型仅支持向量化512 token的内容,对应的中文约为512个
该平台面向企业的研发/技术人员,提供企业专属大模型开发和应用开发的整套工具链,包括数据准备、模型选择/调优、知识工程、模型编排、应用部署、应用集成等能力,降低智能应用开发门槛、提升开发效率。AI原生应用引擎助力企业客户将专属大模型能力融入自己的业务应用链路或对外应用服务中,实现
AI原生应用引擎管理员角色,可以查看工作空间、资产中心,可以管理我的模型、数据集与知识库、我的提示语,还可以创建访问密钥。 AI原生应用引擎开发者 AI原生应用引擎浏览者 组织管理员 AI原生应用引擎开发者 服务级 AI原生应用引擎开发者角色,可以查看工作空间、资产中心,可以管理我的模型、数据集与知识库、我的提示语,还可以创建访问密钥。
API概览 AppStage接口的分类与说明如表1所示。 表1 API概览 类型 说明 模型调用 包含文本对话类、文本向量化类模型服务调用接口。 应用中心 包含Agent调用、用户配置(工作流、技能)调用、文件盒子等接口。 知识中心 包含知识库和知识数据集的创建、删除、执行及查询等接口。
选择左侧导航栏的“实时诊断”。 在左侧树中选择目标数据库类型以及目标节点,选择“空间”页签。 选择“库空间”子页签,单击库列表操作列的“库表空间&元数据分析”,展示所有表。 在表列表中勾选多条表记录,单击“批量查看趋势”,选择不同的时间范围(近3天、近7天、近30天)或直接选择日期区间,单击“查询”,查看该区间内表空间变化趋势。
配置异常检测任务 快速配置异常检测任务 新增异常检测任务 通过调整模型参数对异常告警调优 父主题: 监控资源和应用
则发生异常。如图1黄色部分 超过阈值线3,则数据异常。 图1 固定阈值 动态阈值会通过训练历史数据,实现对数据特征的学习,构建数据的模型。并利用模型来预测数据的趋势走向。如图2黄色部分,实际值和预测值相差过大,认为异常。 图2 动态阈值 异常检测的能力是基于指标仓库,MPPDB数