检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
API概览 AppStage接口的分类与说明如表1所示。 表1 API概览 类型 说明 文本对话 文本对话类模型服务调用。 文本向量化 文本向量化类模型服务调用。 调用知识检索流 调用用户配置的知识检索流。 调用流 调用用户配置的工作流。 调用Agent 调用用户发布的Agent。
模型调用 文本对话 文本向量化 父主题: API
配置监听 部署成功之后需要配置“健康检查”及“转发策略”。 前提条件 需要具备AppStage服务运维岗位权限,权限申请操作请参见申请权限。 操作步骤 登录AppStage。 在快捷入口选择“运维中心”,进入运维中心。 在顶部导航栏选择服务。 单击,选择“微服务开发 > 负载均衡”。
创建工作流 工作流体现的是一个具体的业务场景,通过一系列不同功能节点中的触发事件和执行动作编排而成,开启工作流之后,当起始节点的事件发生,后续动作即可自动执行。AI原生应用引擎通过将传统工具API和大模型编排在一起实现复杂的工作流。 在开发过程中,工作流可在用户创建Agent时调用,有效提高Agent开发的效率。
AppStage的以下计费项支持包年/包月。 表1 计费项说明 套餐包类型 套餐包描述 计费项 说明 问答AI服务基础版 开箱即用的AI问答服务,需配合专业服务使用。支持文本类智能问答。 大模型调用 小规格:1亿token 中规格:2亿token 大规格:4亿token 知识库容量 小规格:20GB 中规格:50GB
微调。 前提条件 已订购大模型微调服务API在线调用-SFT局部调优,订购方法请参见购买AI原生应用引擎按需计费资源。 已具备格式为“对话文本”的微调数据集,具体请参考创建微调数据集或收藏预置微调数据集。 需要具备AI原生应用引擎管理员或开发者权限,权限申请操作请参见AppStage组织成员申请权限。
请求发送以后,您会收到响应,包含状态码、响应消息头和消息体。 状态码是一组从1xx到5xx的数字代码,状态码表示了请求响应的状态,完整的状态码列表请参见状态码。 对于文本对话接口,如果调用后返回状态码为“200”,则表示请求成功。 响应消息头 对应请求消息头,响应同样也有消息头。例如,Content-Type=application/json
在AppStage开发中心通过流水线编译构建版本 流水线管理是开发中心结合流水线CodeArts Pipeline和编译构建CodeArts Build服务的能力,提供可视化、可编排的CI/CD持续交付软件生产线,帮助企业快速转型,实现DevOps持续交付高效自动化,缩短应用TTM(Time
在AppStage开发中心进行版本测试评估 在测试评估页面可以编辑总体测试结论、系统预置的测试类型结论,新增和管理自定义测试类型的测试结论,以及新增和管理版本关键风险问题。 前提条件 已创建版本。 已获取项目经理或测试人员角色权限,权限申请方法请参见申请权限。 查看版本缺陷统计
构建版本 构建版本主要是使用流水线的编排能力,流水线是开发中心结合流水线CodeArts Pipeline和编译构建CodeArts Build服务的能力,提供可视化、可编排的CI/CD持续交付软件生产线,帮助企业快速转型,实现DevOps持续交付高效自动化,缩短应用TTM(Time
测试版本 在产品研发过程中,往往存在各团队、各项目各自为战,产品质量难管控、缺陷修复进度难追踪的问题,严重影响产品交付效率。产品特性和功能在测试验证阶段发现的问题,可以新建缺陷单进行跟踪,对于发现的缺陷进行记录、跟踪、分析和解决,确保软件质量。 操作前须知 缺陷相关功能是开发中心集成需求管理(CodeArts
创建或关闭告警进行模拟测试 监控服务支持手动创建或关闭告警,对告警的其他规则进行模拟测试。 创建告警:快速创建告警,创建的告警与生成上报的告警流程相同,可以用来测试创建的告警升级规则、告警修复规则、值班组等是否正确生效。 关闭告警:关闭已创建的告警,手动恢复该告警。 前提条件 已
创建/配置/执行流水线 流水线是一个可视化的自动化任务调度平台,需要配置编译构建自动化任务(包括添加业务包构建、IaC自动部署包构建任务)才可完整使用,对这些自动化任务进行自定义编排后,一次配置后即可一键自动化触发调度执行,最终生成代码构建产物,避免频繁低效的手工操作。 前提条件
配置开发团队及服务扩展信息 使用开发中心前,需要组织管理员添加开发中心的开发团队用户/成员、创建开发团队,以及配置服务扩展信息即为当前要进行开发的服务关联CodeArts项目。 步骤一:添加开发中心用户 开发中心的用户数根据购买规格有相应的用户数量限制,组织管理员通过用户的添加或删除来合理管理开发中心的使用人员。
按需计费 按需计费是一种先使用再付费的计费模式,适用于无需任何预付款或长期承诺的用户。本文将介绍按需计费资源的计费规则。 适用场景 按需计费适用于资源需求波动的场景,在使用AppStage的用户创建应用、测试模型服务时需要调用ChatGLM3-6B大模型服务API在线调用、大模型
'values.yaml#/values/example_name/peak_tps' 文本内容字符串引用 $ref: 'db/schema.sql' #引用的是schema.sql这个文本文件内容所构成的字符串 带global的多文件描述结构 Spec包通过不同规格目录来描
新建屏幕模板 您可以基于模板来新建站点屏幕,因此在新建屏幕之前您需要在“公共屏幕模板”新建屏幕模板,选择业务所需的页面布局和卡片设置消息联动,从而实现自定义屏幕构建。 前提条件 需要具备AppStage指标开发者或运营管理员权限,权限申请操作请参见权限管理。 已创建我的卡片,具体
在SLB中创建监听 创建负载均衡实例后,需要为SLB实例添加一个或多个监听。监听负责监听负载均衡实例上的请求,根据配置流量分配策略,分发流量到后端服务器处理。 前提条件 需要具备AppStage服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 创建监听 进入AppStage运维中心。
主库等 √ AI原生应用引擎SDK功能介绍 表5 AI原生应用引擎SDK功能矩阵 接口类型 接口名 函数名 Python 大模型相关接口 文本生成 ModelRouter.chat.completion.create √ 向量生成 ModelRouter.embeddings.create
在AppStage开发中心标准发布版本 待版本开发及编译构建完成,且发布准入检查项均通过后,可由开发人员、测试人员或项目经理提交标准发布申请,待项目经理审批通过后,将软件发布到对应的部署平台。 前提条件 已创建版本。 已获取项目经理、开发人员或测试人员角色权限,权限申请方法请参见申请权限。