检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
将基础或者预训练后的模型部署为在线服务时使用的算力单元,通过购买推理单元实现服务QPS扩容。 包年/包月 包年/包月:实例数量*实例单价*购买时长 大模型调用 大模型调用次数。 包年/包月:与“应用并发用户数”一起构成套餐包。 按小、中、大规格计费。 应用并发用户数 同时访问应用的用户数。
配置部署模型参数,参数说明如表6所示。 表6 微调的模型部署参数说明 参数名称 参数说明 实例个数 设置模型服务部署的实例个数。 不同的模型部署1个实例需要的推理单元个数不同,比如,ChatGLM3-6B需要2个实例。 不同的模型因为模型参数量不同,模型参数量越多,需要消耗的资源越多,因此需要的推理单元个数越多。
根据业务需要,可以选择历史版本的配置进行重新部署。 回退微服务版本 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“微服务开发 > 微服务平台”。 选择左侧导航栏的“微服务管理”,单击微服务列表操作列的“部署记录”。 在部署记录列表中,选择待回退的目标版本操作列的 “更多 > 回退”。
进入AppStage的AI原生应用引擎、开发中心、运维中心、运营中心的快捷入口。用户需要申请不同中心的角色,从而具备对应角色的操作权限,可申请的角色以及对应的权限范围请参见权限管理。 5 我的待办/我的申请 选择“我的待办”或“我的申请”页签,可查看我名下的待办或申请的相关事项。 说明:
理能力,供接入云原生的各系统消费。包含新建、迁移纳管、属性维护、变更通知,保证数据的一致性和稳定性。实现统一的架构治理。 通过工具的集成,构建应用全生命周期自动化流程,打破工具间的信息孤岛,实现不同角色和团队间协作,持续改进和自动化,提升效率和应用的服务水平。 在用户使用应用平台
告警屏蔽的状态,屏蔽的时长由屏蔽规则决定。根据屏蔽规则的配置,会选择在指定时间点执行用户预置的告警修复流程。 当告警处于屏蔽状态的时不会进行通知,此时告警仍然可以接收对应已解决的告警。 屏蔽时间到达后,会根据告警的状态决定是否唤醒告警,如果在屏蔽期间,通过告警修复或自然上报就已经
只能包含数字、字母、“-”、“_”,且字符长度不超过32。 应用 默认显示当前服务的产品中文名,不可修改。 服务 选择需要创建账号的服务,不选默认为所在产品下所有服务可用。 是否默认账号 选择创建的账号是否为选择服务的默认账号。 每个服务可以创建多个运维账号,只能设置其中一个为默认账号。 导入运维账号
选择左侧导航栏的“Terraform引擎 > 实例列表”,选择实例类型进行查询,展示实例列表。 选择左侧导航栏的“Terraform引擎 > 实例管理”,选择“微服务实例”页签或“服务实例”页签,展示实例列表。 单击待上传实例代码包的实例所在行“操作”列的“新增版本”。 上传代码包并选择包版本号,单击“确定”。
服务级IaC包:选择服务级IaC包的版本和规格。服务级IaC包为“spec”类型的包,可以定义环境下的流水线和组件,以及组件下的资源。 变更任务流:基于用户选择的服务级IaC包,系统可以获取此包定义的所有流水线,可以选择其中一个用于执行变更。若不选择流水线,则系统会生成一条执行环境下所有组件的流水线。变更的内容是spec包中声明的所有组件。
instanceName String 是 关联的slb实例名,仅能关联同一注册中心下的slb实例。 domain String 否 域名,多个域名不可重复,只允许数字、字母、下划线、“.”和“*”。 certificate String 否 证书名,需为领域下已录入证书。 listeners
必填项,选择系统中已提前创建的部门。 关联服务 必填项,选择系统中已提前创建并发布的服务。 团队LOGO 必填项,单击系统默认图片上的“点击修改”,可选择本地图片自定义LOGO图片。 团队简介(可选) 非必填项,团队空间的功能描述或其他备注信息。 单击“创建”。 在“我的团队”区域可查看到创建的团队的卡片。
为AppStage关联组织后不可更换组织,请谨慎选择关联的组织。 前提条件 登录用户为已实名认证的华为账号或华为云账号。 已购买AppStage。 关联组织 登录AppStage控制台。 在左侧导航,选择“总览”,在页面顶部根据提示单击“去关联”;或在“应用平台使用向导”区域的“关联组织”节点单击“去关联”以关联使用AppStage的组织。
选择左侧导航栏的“主机列表”,选择需要修改服务归属的主机类型,如“弹性云服务器”。 在主机列表勾选需要修改服务归属的主机,单击“修改服务归属”。 在“修改服务归属”页面修改使用服务及归属服务,单击“确定”。 在页面上方“自有服务”选择已修改的服务。 选择左侧导航栏的“任务管理 >
应用引擎SDK,方便开发者将AppStage的能力快速集成到自己的应用中。 本文介绍了AppStage提供的开放API的SDK语言版本,列举了最新版本SDK的获取地址。 约束与注意事项 运维中心提供的SDK是基于Java1.8版本开发的,如果Spring Cloud项目使用Jav
是告警中状态且未被清除和屏蔽的告警。 屏蔽告警 告警进入系统后被设置的屏蔽规则自动屏蔽或者人为在界面上手动单击屏蔽的告警。屏蔽的告警分为两种,一种是有具体屏蔽时间的,到了屏蔽时间结束后会作为一条新的告警再次出现在当前告警的列表中,一种是没有屏蔽时间的,将会被永久屏蔽。 历史告警
Scrum 增量迭代式的软件开发方法,通过最重要的迭代计划会议、每日站会、迭代回顾、验收会议来进行简单高效的管理。 IPD-系统设备类 面向系统设备类产品开发场景的IPD需求管理方法,通过结构化流程、强大的跨项目协作能力来对大型产品开发进行高质高效的管理。 IPD-独立软件类 面向
当前仅部分区域的主机支持接入AppStage运维中心,包括华北-北京四、华南-广州、华东-上海一、华东-上海二和华北-乌兰察布一 ,如需接入其他区域的主机,请联系技术支持工程师。 支持接入的主机操作系统如表1所示,其余类型的主机无法接入AppStage运维中心。 表1 支持的主机操作系统
应用数据接入一次性任务运行失败 问题描述 应用数据接入时,执行一次性任务,提示运行失败。 处理方法 应用数据接入时,OBS路径必须填文件夹的路径,不可以填文件的路径,否则将会导致运行失败。 父主题: 运营中心
新建模型失败 问题描述 新建数据模型时,提示保存失败。 处理方法 检查数据模型度量数据的“聚合类型”函数设置是否合理,比如“聚合类型”设置为求和“sum”函数,这种情况会导致数据建模保存报错。 父主题: 运营中心
应用数据接入周期性任务运行失败 问题描述 应用数据接入时,执行周期性任务,提示运行失败。 处理方法 检查数据文件是否按照要求放在pt_d=****/pt_h的文件夹下面。 父主题: 运营中心