检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
微调任务执行完成后,单击“操作”列的“发布”,发布模型。 步骤三:部署模型 部署模型是将模型部署为在线服务,通过创建部署服务实现,创建成功后,可以对在线服务可以进行预测和调用。本文需要为基座模型(原模型)和微调后的新模型分别创建模型服务。由于在线运行需消耗资源,请确保账户未欠费。 在AI原生应用引擎的左侧导航栏选择“模型中心
2.进入AI原生应用引擎,在左侧导航栏选择“知识中心 > 知识库”,可从页面知识库ID栏获取。 约束限制: 不涉及。 取值范围: 只能由英文字母、数字以及“-”组成,且长度为36个字符。 默认取值: 不涉及。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 Authorization
本文介绍如何将微调后的模型或部分平台资产中心的模型部署为模型服务。 前提条件 已购买推理单元资源,具体购买方法请参见购买AI原生应用引擎包年包月资源。 由于在线运行需消耗资源,请确保账户有可用资源,且用户费用状态正常。 需要具备AI原生应用引擎管理员或开发者权限,权限申请操作请参见AppStage组织成员申请权限。
应用实例数量*套餐包单价*购买时长 请参见购买页面中的套餐包单价。 变更配置后对计费的影响 当前包年/包月套餐包规格不满足您的业务需要时,您可以在AppStage控制台发起变更规格操作,变更时系统将按照如下规则为您计算变更费用: 资源升配:新配置价格高于老配置价格,此时您需要支付新老配置的差价。
管理我的卡片 所有卡片都可以在“我的卡片”列表中查看。 您还可以在“我的卡片”界面执行如表1的操作。 表1 相关操作 操作 说明 切换卡片显示方式 :以卡片形式展示。默认以卡片形式展示。 :以列表形式展示。 筛选卡片 通过卡片的状态、卡片来源、排序方式筛选卡片。 升级卡片 卡片形式:在需要升级的卡片上,单击“升级”。
SaaS:ChatGLM3-6B大模型服务API在线调用 自定义模型训练 API SaaS:大模型微调服务API在线调用-SFT局部调优 说明: 按需仅适用于AppStage的AI原生应用引擎。 变更计费模式 不支持。 不支持。 变更规格 支持变更套餐规格。 不支持。 适用场景 适用于可
is_response_verify 否 Boolean 参数解释: 是否开启返回体内容审核(默认不开启)。 有文本内容,则对文本进行内容审核; 有图片内容,则会对图片进行内容审核。 约束限制: 不涉及。 取值范围: true或false 默认取值: false。 响应参数 状态码: 200 表7
计费项说明 适用的计费模式 计费公式 ChatGLM3-6B大模型服务API在线调用 根据实际输入和输出tokens总量计费,平台提供算力支持。 按需计费 千tokens * 每千tokens单价 大模型微调服务API在线调用-SFT局部调优 根据实际输入和输出tokens总量计费,平台提供算力支持。
屏幕名称/屏幕分组/屏幕描述:可修改。 屏幕尺寸:可对屏幕尺寸进行修改,包含默认、2K屏、4K屏和自定义。 编辑状态:可以通过切换编辑状态设置屏幕是否可编辑。 主题背景:可以单击“切换主题背景”切换主题风格。 渐进渲染/屏幕水印/版权信息/悬浮按钮:根据需求开启。 版面属性 屏幕全屏/平台渲染/微前端加载:根据需求开启或关闭。
大语言模型的应用范围非常广泛,包括自然语言处理、机器翻译、语音识别、智能问答等领域。 向量化模型 向量化模型是将文本数据转换为数值向量的过程。常用于将文本转换为机器可以处理的形式,以便进行各种任务,如文本分类、情感分析、机器翻译等。 多模态模型 多模态模型是指能够处理多种类型数据
调用记录ID。 取值范围: 只由英文字母、数字以及“-”组成,且长度为36个字符。 version Number 参数解释: 工具的版本号。 取值范围: 正整数。 connector_id String 参数解释: 工具ID。 取值范围: 只由英文字母、数字以及“-”组成,且长度为36个字符。
以应用为运维对象,支持应用上下线变更、可靠&可用性、成本等管理。 应用全栈全链路数据可观测,使用AIOps算法支撑应用自动化灰度变更、故障智能化诊断与恢复等场景。 应用生命周期数据可视化,避免数据孤岛。 全自动化 无人值守变更,帮助企业提升运维效率。 自动化评审,在可控的风险、适合的时间执行变更,降低人工评审成本,减少人为判断失误。
新建及管理我的卡片 新建卡片分类为卡片分组 使用在线构建方式新建卡片 使用模板构建方式新建卡片 使用离线构建方式新建卡片 管理我的卡片 父主题: 在运营中心自定义运营看板
处理变更电子流 变更电子流提交后会走给审批人处理,设置的各级审批人审批变更方案的合理性后,会走给变更实施人做变更实施,变更实施人处理后,会走给变更验证人验证变更是否成功。 处理变更电子流 进入AppStage运维中心。 将鼠标悬停在右上角的账号,选择下拉列表中的“工单管理”,默认显示“变更单管理”页面。
变更组件 组件是具有相同资源的集合,使用组件对资源进行统一管理。部署服务支持单独变更在IaC Patch包(软件仓库中IaC 3.0包的iacpatch包类型)中定义的组件资源,IaC Patch包目录结构如IaC Patch包典型目录结构所示。 前提条件 已获取服务运维岗位权限
我的Agent”,选择“我创建的”页签,选择列表操作列的“更多 > 修改”,在浏览器地址栏查看id。 约束限制: 不涉及。 取值范围: 由英文字母和数字组成,长度为32个字符。 默认取值: 不涉及。 attachment-code 是 String 参数解释: 附件码。此处请填写固定值:ai-file-box。
对处于保留期的按需计费资源执行任何操作。 保留期到期后,如果您仍未支付账户欠款,那么ChatGLM3-6B大模型服务API在线调用、大模型微调服务API在线调用-SFT局部调优将无法再使用。 图1 按需计费AI原生应用引擎资源生命周期 华为云根据客户等级定义了不同客户的宽限期和保留期时长。
版本变更记录 表1 版本变更记录 版本 变更类型 说明 0.0.1 - 第一次发布。 父主题: AI原生应用引擎SDK API
RDS for PostgreSQL数据库,需要选择Schema关联的Database名称。 Schema名称:填写Schema名称。以英文字母开头,只能输入小写字母、数字、下划线,且长度为1~63,支持一次创建多个Schema,多个Schema以分号分隔。 父主题: 在WiseDBA中创建和管理Schema
负载均衡”。 选择左侧导航栏的“监听管理”。 在监听管理页面,单击监听名称。 在监听详情页面选择“后端服务器”页签,检查该后端服务器集群中的节点是否都在线,如果都下线会报此错误。 父主题: SLB同步异常相关问题