检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
微调任务执行完成后,单击“操作”列的“发布”,发布模型。 步骤三:部署模型 部署模型是将模型部署为在线服务,通过创建部署服务实现,创建成功后,可以对在线服务可以进行预测和调用。本文需要为基座模型(原模型)和微调后的新模型分别创建模型服务。由于在线运行需消耗资源,请确保账户未欠费。 在AI原生应用引擎的左侧导航栏选择“模型中心
档、升级指导书、版本配套表等交付件类型,同时可以添加自定义类型交付件,并为交付件上传文件作为交付件模板。在交付件管理页面,用户可以通过创建在线文档或上传离线文档两种方式创建及管理交付件文档,保证版本开发过程阶段性成果沉淀以及过程可追溯。 版本基线化 版本基线化是指在版本发布前,选
生费用,请在自动续费扣款日(默认为到期前7日)之前关闭自动续费。 按需计费资源 对于按需计费模式的资源,例如按需计费的大模型微调服务API在线调用-SFT局部调优,如果不再使用这些资源且需停止计费,请删除相应资源。 退订包年包月资源以停止计费 登录AppStage控制台,默认进入AppStage控制台“总览”页。
}}中。 引用模板提示语内容: 单击输入框右侧的“引用模板”选择我创建的、我收藏的或平台预置的提示语模板。 在“在线优化”页面,参照表2进行参数配置。 表2 提示语在线优化参数说明 参数名称 参数说明 变量标识符 可选择以下符号标识提示语内容中的变量。 大括号{} 双大括号{{}}
SDK种子节点IP SDK种子节点IP信息。 实例种子节点IP 实例种子节点IP信息。 全表扫描 选择是否开启全表扫描。 在线压测 选择是否开启在线压测。 慢查询阈值 超过慢查询阈值的记录为慢sql,默认值为2000。 请求路由优化 是否开启请求路由优化。开启请求路由优化,可使请求优先访问有数据的节点,减少转发。
SDK种子节点IP SDK种子节点IP信息。 实例种子节点IP 实例种子节点IP信息。 全表扫描 选择是否开启全表扫描。 在线压测 选择是否开启在线压测。 慢查询阈值 超过慢查询阈值的记录为慢sql,默认值为2000。 请求路由优化 是否开启请求路由优化。开启请求路由优化,可使请求优先访问有数据的节点,减少转发。
使告警上报更加统一、准确。 告警修复 设置特定的命中条件,告警在发送通知之前会执行预置的修复脚本,进行修复操作,自动帮你修复简单的告警。 语音值班配置 当告警生成时,配置对应的责任人,通过WeLink、短信、电话等多种形式,快速将异常情况通知到责任人。 日志 日志是指设备、系统或
在VMS登录弹性云服务器主机 在VMS页面可以直接登录已纳管的弹性云服务器主机。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 登录业务主机 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 主机管理服务(VMS)”。
取消弹性云服务器主机纳管 将华为云已购买的弹性云服务器接入AppStage后,如果不再使用该主机,支持取消纳管该主机。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 取消主机纳管 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维
(可选)录入HTTPS监听所需的服务器证书 配置HTTPS监听时,涉及服务器身份验证,需要为监听绑定服务器证书。本文介绍如何录入服务器证书。 前提条件 已获取服务器证书。 需要具备AppStage服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 创建证书 进入AppStage运维中心。
(可选)录入HTTPS监听所需的服务器证书 配置HTTPS监听时,涉及服务器身份验证,需要为监听绑定服务器证书。本文介绍如何录入服务器证书。 前提条件 已获取服务器证书。 需要具备AppStage服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 创建证书 进入AppStage运维中心。
在VMS变更弹性云服务器主机规格 在VMS页面可以直接变更已纳管的弹性云服务器主机的规格。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 变更主机规格 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 主机管理服务(VMS)”。
基于NUWA微服务开发框架,预集成构建云服务业务分布式架构所需的各个组件及高可用能力,实现开箱即用。 提供业务运行时管理,支持业务优雅启停、启动加速、在线诊断等能力。 提供流量控制、资源动态伸缩、容错容灾等能力,使能业务具备韧性。 提供云原生中间件与数据库管理,结合华为面向10亿+移动用户应用治理经验,兼具高并发与高可靠能力。
优化提示语 在AI原生应用引擎的左侧导航栏选择“知识中心 > 提示语”。 在我的提示语列表中,单击操作列的“优化”,参照表1进行参数配置。 表1 在线优化提示语参数说明 参数名称 参数说明 变量标识符 可选择以下符号标识提示语内容中的变量。 大括号{} 双大括号{{}} 中括号[] 双中括号[[]]
升级弹性云服务器主机已安装的OpsAgent 可以在“弹性云服务器”页面升级主机已安装的OpsAgent。 前提条件 已获取基础运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 升级OpsAgent 进入AppStage运维中心。 单击,选择“运维 > 主机管理服务(VMS)”。
缺陷的闭环。 知识库 知识库是面向开发团队的知识管理系统,支持知识全生命周期管理,帮助您完成智能、安全的知识作业,提供层级式的目录树、多人在线协同编辑等功能。 开发插件库 提供多种预置的开发插件,同时组织管理员可以上传用户需要的其他本地插件至开发插件库进行灵活管理,也可以为插件分类创建标签,便于快速筛选及查找。
unt/s。 在线会话数量 该指标用于统计当前在线的session个数,该值为实时值,单位:Count。 活跃会话数量 该指标用于统计当前所有活跃工作状态下会话个数,该值为实时值,单位:Count。 在线会话率 该指标用于统计CN(分布式)/主DN(主备版)上的在线会话比例,该值为实时值,单位:%。
unt/s。 在线会话数量 该指标用于统计当前在线的session个数,该值为实时值,单位:Count。 活跃会话数量 该指标用于统计当前所有活跃工作状态下会话个数,该值为实时值,单位:Count。 在线会话率 该指标用于统计CN(分布式)/主DN(主备版)上的在线会话比例,该值为实时值,单位:%。
将弹性云服务器主机设置为执行机 已纳管的Linux主机可以设置为执行机,执行机将在部署服务虚拟机部署、监控服务日志接入/脚本执行、演练服务执行快速演练任务、负载均衡创建实例、数据库治理纳管实例和数据查询时使用。 前提条件 已获取基础运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。
将已归档的弹性云服务器主机恢复至可用状态 弹性云服务器主机长时间不使用会进入到归档状态,归档状态即一种暂时回收的状态。恢复主机状态可以将已归档主机恢复到可用状态。 前提条件 已获取基础运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 恢复主机状态 进入AppStage运维中心。