检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
4 大模型 大模型页签下展示平台预置的大模型和平台接入的第三方模型服务。 平台预置的开源模型 开源模型Qwen系列、DeepSeek系列等。 请参考将已有模型部署为模型服务进行部署,部署后即可进行调测/体验、调用。 平台预置开源模型chatglm3-6b,并提供对应的模型服务AP
据超过上限或是低于下限则发生异常。如图1黄色部分 超过阈值线3,则数据异常。 图1 固定阈值 动态阈值会通过训练历史数据,实现对数据特征的学习,构建数据的模型。并利用模型来预测数据的趋势走向。如图2黄色部分,实际值和预测值相差过大,认为异常。 图2 动态阈值 异常检测的能力是基于
AI原生应用引擎概览页介绍 进入AI原生应用引擎 登录AppStage。 在快捷入口选择“AI原生应用引擎”,进入AI原生应用引擎。 概览页介绍 在AI原生应用引擎的左侧导航栏选择“概览” ,进入概览页,可获得系统中各资源数据概览及产品的相关快速指引。 概览页分为数据统计、选择应
单击输入框右侧的“引用模板”选择我创建的、我收藏的或平台预置的提示语模板。 推理模型 将提示语应用于我创建的、平台预置的或第三方模型服务中,预览推理结果。 选择推理模型后,可配置推理模型的相关参数,如表3所示。 表3 推理模型参数配置说明 参数名称 参数说明 最大token数 影响推理返回内容的最大长度,取值范围:1-10000。
告警后触发知识编排任务提示alert_type不存在 如何从ENS找到服务容器绑定的安全组? 更多 运营中心 如何处理应用数据接入一次性任务运行失败? 如何处理应用数据接入周期性任务运行失败? 如何处理AK/SK填写错误? 如何处理数据模型修改或者删除失败? 如何处理新建模型失败? 如何处理指标摸板库生成的指标运行失败?
集进行模型训练、知识库构建等,快速完成平台使用并验证模型训练效果。 模型管理 用户可以自定义创建模型、模型服务及在线测试模型,检验模型的准确性、可靠性及反应效果。 提示语管理 用户自定义创建的、收藏的以及平台预置的提示语模板进行优化和改进。 大模型微调 提供调整大型语言模型的参数
、测试模型服务时需要调用ChatGLM3-6B大模型服务API在线调用、大模型微调服务API在线调用-SFT局部调优,按需计费模式能大幅降低客户的业务成本。 适用计费项 AI原生应用引擎的以下计费项支持按需计费。 表1 适用计费项 计费项 说明 ChatGLM3-6B大模型服务API在线调用
和推理方向。 大语言模型 大语言模型是一种能够理解和生成人类语言的人工智能模型。这些模型通常使用大量的数据进行训练,以便它们能够识别语言中的模式和规律。大语言模型的应用范围非常广泛,包括自然语言处理、机器翻译、语音识别、智能问答等领域。 向量化模型 向量化模型是将文本数据转换为数
收藏资产中心预置的AI应用 支持收藏平台资产中心预置的AI应用。将自己关注的AI应用收藏后,可便捷地在收藏列表中查看应用详情及体验Agent。 前提条件 需要具备AI原生应用引擎管理员或开发者权限,权限申请操作请参见AppStage组织成员申请权限。 收藏资产中心预置AI应用 在AI原生应用引擎的左侧导航栏选择“资产中心”。
在异常检测任务模型配置的“算法配置”页面,查看“输出表名”改为新的系统自动创建的输出表。 在异常检测任务模型配置的“训练配置”页面,单击“立即训练”。 父主题: 异常检测Judge定时任务失败
应用指标摸板库生成指标运行失败 问题描述 应用指标摸板库生成指标时,提示运行失败。 处理方法 检查选择的数据源和应用的模型是否匹配。模型对选择的数据是有要求的,数据源和模型之间不匹配,将导致指标运行失败。 父主题: 运营中心
资产(Agent、模型、数据集、提示语、工具及知识库)统计数据,并支持通过各资产面板,筛选查看各子部门资产的创建、收藏及订阅数据。 前提条件 需要具备AI原生应用引擎租户运营管理员权限,权限申请操作请参见AppStage组织成员申请权限。 查看资产总览 在AI原生应用引擎的左侧导航栏选择“运营看板
事件和执行动作编排而成,AI原生应用引擎通过将传统工具API和大模型编排在一起实现复杂的工作流。工作流可在用户创建Agent时调用,Agent使用过程中,当起始节点触发,后续动作即可自动执行,完成一系列复杂的任务。 创建Agent(LLM模式)时,由大模型根据用户问题与工作流的关联性决策是否调用工作流。
基本流程。API调用方法请参见如何调用API。 前提条件 准备一篇名为“问题.txt”的文档,文档内容为: “什么是量子计算?它是一种利用量子力学原理进行信息处理的计算方式。==== 什么是RAG?它是一种通过整合检索系统和生成模型的优势,来提升模型生成文本的质量和上下文相关性。====”
适用计费项 AI原生应用引擎 AI应用服务:问答AI服务基础版、问答AI服务专业版 知识库:知识库容量包(10GB) 智能应用运行时引擎:智能应用运行时引擎(1实例)、智能应用运行时引擎(20实例) 模型部署:推理单元包周期 AI原生应用引擎基础版 AI原生应用引擎专业版 AI原生应用引擎企业版
judge长时间处于SUBMIT状态直至失败 问题现象 judge记录一直处于提交未执行SUBMIT状态,直至失败FAIL。 可能原因 后端任务内存溢出,可以在训练日志中的ad-agent日志找到报错java.lang.OutOfMemoryError:Java heap space。
通过运营看板查看AI原生应用引擎资产总览 查看资产总览 查看模型调用统计 查看Agent调用统计
策略配置”。 单击“统一告警定义”,进入告警定义页面。 单击“创建”。 配置AIOps规则参数,参数说明如表1所示,配置完成后,单击“确定”。 表1 AIOps规则参数说明 参数名称 参数说明 指标来源 选择告警的指标来源“AIOps”。 告警定义名称 自定义告警定义的名称。 级别 选择该规则生成告警的级别。
如何获取Agent发布时要所需的API Key? 填写AI原生应用引擎平台的API Key,生成方式请参见新增平台API Key。 父主题: AI原生应用引擎
构造请求 本节介绍REST API请求的组成,并以调用AppStage服务的文本对话接口说明如何调用API。 您还可以通过这个视频教程了解如何构造请求调用API:https://bbs.huaweicloud.com/videos/102987 。 请求URI 请求URI由如下部分组成。