检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
本文介绍如何将微调后的模型或部分平台预置的模型部署为模型服务。 前提条件 已购买推理单元资源,具体购买方法请参见购买AI原生应用引擎包年包月资源。 由于在线运行需消耗资源,请确保账户有可用资源,且用户费用状态正常。 需要具备AI原生应用引擎管理员或开发者权限,权限申请操作请参见AppStage组织成员申请权限。
购买AppStage运营中心 首次使用需要先购买运营中心专业版,具体操作请参见购买AppStage。 配置服务授权 购买运营中心后,系统将自动识别并弹框提示进行服务授权,同意服务授权后,AppStage将在统一身份认证服务IAM中为账号创建名称为appstage_admin_agency的委托。
M3-6B服务、大模型调优服务API在线调用。 套餐包单价+按需计费(ChatGLM3-6B服务、大模型调优服务API在线调用) 知识库容量:50GB 智能应用运行时引擎(20实例):2个 ChatGLM3-6B服务、大模型调优服务API在线调用根据实际输入和输出tokens总量计费,计费规则请参考按需计费
更多操作 创建微调任务完成后,可执行如表4所示的操作。 表4 更多操作 操作 说明 查看任务详情 在“模型微调流水线”页面的任务列表中,单击任务名称或单击“操作”列“更多 > 运行日志”,查看任务的基础信息、参数信息、运行日志以及Loss曲线等详情,并支持对模型之间的关系进行溯源。
AppStage开发中心知识库是面向开发团队的知识管理系统,支持知识全生命周期管理,帮助您完成智能、安全的知识作业,提供层级式的目录树、多人在线协同编辑等功能。 目前此功能仅支持白名单用户通过提交工单申请使用。详细操作请参考提交工单。 前提条件 已获取项目经理、开发人员或测试人员角色权限,权限申请方法请参见申请权限。
有服务注册和发现、业务故障隔离、服务路由、服务间调用关系正向设计和治理、微服务配置中心等特性。 支持区域: 华北-北京四 查看微服务列表 查看数据库列表 查看中间件 负载均衡 负载均衡(SLB)基于Nginx/OpenResty构建,作为业务前置的流量接入网关,提供反向代理、负载
代码仓管理是开发中心集成代码托管CodeArts Repo服务的能力,是遵循Git的基本运行模式的分布式版本管理平台,其具备安全管控、成员/权限管理、分支保护/合并、在线编辑、统计服务等功能,旨在解决软件开发者在跨地域协同、多分支并发、代码版本管理、安全性等方面的问题。 关于代码仓管理的常见问题请参见代码托管(CodeArts
代码仓管理是开发中心集成代码托管CodeArts Repo服务的能力,是遵循Git的基本运行模式的分布式版本管理平台,其具备安全管控、成员/权限管理、分支保护/合并、在线编辑、统计服务等功能,旨在解决软件开发者在跨地域协同、多分支并发、代码版本管理、安全性等方面的问题。 如果您计划开始一个新项目,那么您可以
管理员权限,权限申请操作请参见申请权限。 步骤一:生成敏感配置项坐标 无论通过什么方式获取敏感配置,都需要有一个唯一标识,让STS可以准确查找到敏感配置项,该标识称为“敏感配置项坐标”。 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“安全 > 访问凭据管理服务”。
运行时引擎依赖于运维中心能力,首次使用需要先购买运维中心,具体操作请参见购买AppStage。 配置服务授权 购买运行时引擎后,系统将自动识别并弹框提示进行服务授权,同意服务授权后,AppStage将在统一身份认证服务IAM中为账号创建名称为appstage_admin_agency的委托。
购买AppStage运维中心 首次使用需要先购买运维中心专业版,具体操作请参见购买AppStage。 配置服务授权 购买运维中心后,系统将自动识别并弹框提示进行服务授权,同意服务授权后,AppStage将在统一身份认证服务IAM中为账号创建名称为appstage_admin_agency的委托。
微调任务执行完成后,单击“操作”列的“发布”,发布模型。 步骤三:部署模型 部署模型是将模型部署为在线服务,通过创建部署服务实现,创建成功后,可以对在线服务可以进行预测和调用。本文需要为基座模型(原模型)和微调后的新模型分别创建模型服务。由于在线运行需消耗资源,请确保账户未欠费。 在AI原生应用引擎的左侧导航栏选择“模型中心
购买AI原生应用引擎、运维中心或运营中心之后,系统将自动识别到您未同意服务授权并弹框提示您进行服务授权。 (可选)在应用平台控制台左侧导航,选择“服务授权”,在“服务授权”页面,单击“一键授权”,重新授权;或在“服务授权”页面的服务授权列表中,单击待授权的云服务名称,在“查看权限详情”页面,单击“补充授权”,补充授权。
生费用,请在自动续费扣款日(默认为到期前7日)之前关闭自动续费。 按需计费资源 对于按需计费模式的资源,例如按需计费的大模型微调服务API在线调用-SFT局部调优,如果不再使用这些资源且需停止计费,请删除相应资源。 退订包年包月资源以停止计费 登录AppStage控制台,默认进入AppStage控制台“总览”页。
新建完缺陷后,可以查看缺陷详情,新建子缺陷,复制缺陷,对缺陷批量导入导出、进行修改或删除,进行批量复制、批量编辑和批量删除操作等。 请参见管理工作项中的“Bug”。 缺陷(Bug)详情 在缺陷详情页面,除了可以修改缺陷的处理人、状态等,还可以查看关联缺陷、查看工作代码提交记录、查看缺陷操作历史、添加附件等。
购买AI原生应用引擎、运维中心或运营中心之后,系统将自动识别到您未同意服务授权并弹框提示您进行服务授权。 (可选)在应用平台控制台左侧导航,选择“服务授权”,在“服务授权”页面,单击“一键授权”,重新授权;或在“服务授权”页面的服务授权列表中,单击待授权的云服务名称,在“查看权限详情”页面,单击“补充授权”,补充授权。
计费项说明 适用的计费模式 计费公式 ChatGLM3-6B大模型服务API在线调用 根据实际输入和输出tokens总量计费,平台提供算力支持。 按需计费 千tokens * 每千tokens单价 大模型微调服务API在线调用-SFT局部调优 根据实际输入和输出tokens总量计费,平台提供算力支持。
Req)服务中“缺陷(Bug)”相关的能力,缺陷管理严格把控缺陷提出、分析、修复、测试、验收、关闭的完整流程,提供跨项目的缺陷作业跟踪追溯能力,实时识别产品缺陷风险,为组织的产品交付质量提供保障。 Scrum项目:在开发中心直接创建缺陷,创建后数据会同步至CodeArts Req服务中,具
新建及管理我的卡片 新建卡片分类为卡片分组 使用在线构建方式新建卡片 使用模板构建方式新建卡片 使用离线构建方式新建卡片 管理我的卡片 父主题: 在运营中心自定义运营看板
关闭分享状态:屏幕不分享,仅该租户下的用户可查看此屏幕。 开启分享状态:屏幕分享,该租户及其他租户下的用户均可查看此屏幕。 无限制:发布时,复制分享链接。发布后,输入分享链接查看此屏幕。 分享码:发布时需要设置分享码及分享码的有效期,复制分享链接及分享码。发布后,输入分享链接及分享码查看此屏幕。 toke