检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
和推理方向。 大语言模型 大语言模型是一种能够理解和生成人类语言的人工智能模型。这些模型通常使用大量的数据进行训练,以便它们能够识别语言中的模式和规律。大语言模型的应用范围非常广泛,包括自然语言处理、机器翻译、语音识别、智能问答等领域。 向量化模型 向量化模型是将文本数据转换为数
集进行模型训练、知识库构建等,快速完成平台使用并验证模型训练效果。 模型管理 用户可以自定义创建模型、模型服务及在线测试模型,检验模型的准确性、可靠性及反应效果。 提示语管理 用户自定义创建的、收藏的以及平台预置的提示语模板进行优化和改进。 大模型微调 提供调整大型语言模型的参数
千tokens * 每千tokens单价 推理单元 将基础或者预训练后的模型部署为在线服务时使用的算力单元,通过购买推理单元实现服务QPS扩容。 包年/包月 包年/包月:实例数量*实例单价*购买时长 大模型调用 大模型调用次数。 包年/包月:与“应用并发用户数”一起构成套餐包。 按小、中、大规格计费。
该平台面向企业的研发/技术人员,提供企业专属大模型开发和应用开发的整套工具链,包括数据准备、模型选择/调优、知识工程、模型编排、应用部署、应用集成等能力,降低智能应用开发门槛、提升开发效率。AI原生应用引擎助力企业客户将专属大模型能力融入自己的业务应用链路或对外应用服务中,实现
运营中心:运营中心专业版、运营中心看板增量包、运营中心指标增量包-10个指标、运营中心指标增量包-100个指标 预置模型服务调用 API SaaS:ChatGLM3-6B大模型服务API在线调用 自定义模型训练 API SaaS:大模型微调服务API在线调用-SFT局部调优 说明: 按需仅适用于AppStage的AI原生应用引擎。
任务配置完成后该任务会显示在任务列表,单击任务所在行“操作”列的“基础”,单击“字段配置”,参考表5修改基础数据,获取维度值。 参考步骤四:配置训练模型配置异常检测算法模型,并进行模型训练。 训练的汇聚任务可以选择左侧导航栏“AI辅助诊断 > 任务配置”,选择“异常检测 > 汇聚任务管理”查看。 父主题:
),从而增强大语言模型对复杂信息的理解和推理能力。 向量化配置 向量化模型 向量化模型是将文本数据转换为数值向量的过程。常用于将文本转换为机器可以处理的形式,以便进行各种任务,如文本分类、情感分析、机器翻译等。 支持选择模型服务商API、预置模型API、我的模型API(我部署的、我接入的)。
运营中心 应用数据接入一次性任务运行失败 应用数据接入周期性任务运行失败 AK/SK填写错误 数据模型修改或者删除失败 新建模型失败 应用指标摸板库生成指标运行失败
使用AI原生应用引擎完成大模型调优并测试效果 05 开发 介绍如何开发业务代码以及IaC部署代码。 开发指南 使用Spring Cloud框架实现应用开发 应用平台IaC部署代码开发 06 API 通过AppStage的AI原生应用引擎开放的API和调用示例,您可以使用并管理模型服务、知识库等。
API概览 AppStage接口的分类与说明如表1所示。 表1 API概览 类型 说明 模型调用 包含文本对话类、文本向量化类模型服务调用接口。 应用中心 包含Agent调用、用户配置(工作流、技能)调用、文件盒子等接口。 知识中心 包含知识库和知识数据集的创建、删除、执行及查询等接口。
则发生异常。如图1黄色部分 超过阈值线3,则数据异常。 图1 固定阈值 动态阈值会通过训练历史数据,实现对数据特征的学习,构建数据的模型。并利用模型来预测数据的趋势走向。如图2黄色部分,实际值和预测值相差过大,认为异常。 图2 动态阈值 异常检测的能力是基于指标仓库,MPPDB数
击“Save”。 单击维度“列名”后的减号,删掉新增的空维度,单击“确认”。 在异常检测任务模型配置的“算法配置”页面,查看“输出表名”改为新的系统自动创建的输出表。 在异常检测任务模型配置的“训练配置”页面,单击“立即训练”。 父主题: 异常检测Judge定时任务失败
系化的工具能力和持续的研发知识沉淀,研发工具能力建设影响业务的发展。应用平台开发中心通过一站式工具链实现流程Build In,提供海量研发资产模板,帮助客户实现研发的持续反馈和能力沉淀,提升研发能力和效率。 开发中心功能介绍 开发中心的主要功能如表1所示。 表1 开发中心功能介绍
API 模型调用 应用中心 知识中心
用于设置当前分段开头与上一个分段结尾重叠部分的长度。 索引配置 向量化模型 选择向量化模型,向量化模型可以将文本数据转换为数值向量,常用于将文本转换为机器可以处理的形式,以便进行各种任务,如文本分类、情感分析、机器翻译等。 当前模型仅支持向量化512 token的内容,对应的中文约为512个
配置异常检测任务 快速配置异常检测任务 新增异常检测任务 通过调整模型参数对异常告警调优 父主题: 监控资源和应用
结束节点作为整条工作流的输出返回,需配置响应体、状态码、响应头参数。 表1 结束节点参数说明 参数 说明 选择回答模式 由Agent生成回答:Agent绑定了大模型时,由大模型对工作流的输出进行总结,生成自然语言回答。 使用设定内容直接回答(对象或数组类型):该模式仅单Agent工作流模式或工作流选择精确模
ken长度超过向量化模型的token数,则自动对超长部分进行截断处理)。 SMART_MODE(智能模式:如果分片的token长度超过向量化模型的token数,则知识库向量化失败)。 DEFAULT_MODE(默认模式:如果分片的token长度超过向量化模型的token数,则知识库向量化失败)。
说明 计费项 适用的计费模式 计费公式 开发中心专业版 支持统一应用架构建模、产品/版本/个人级协作管理、一站式开发工具链、研发效能洞察、海量资产模板。 开发中心用户数 包年/包月 用户数量*套餐包单价*购买时长 运维中心专业版 支持视界监控服务、纪实日志服务、追踪者调用链服务、先知
HttpxClient 实例化 表1 实例化参数 参数名 参数类型 是否必选 参数描述 base_url str False 模型网关开放的ip和端口,有默认值可以不填。功能类似OpenAI的base_url。 custom_hearders dict False 其他自定义请求头信息。