正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在“在线优化”页面,参照表1进行参数配置。 表1 提示语在线优化参数说明 参数名称 参数说明 变量标识符 可选择以下符号标识提示语内容中的变量。
在监听详情页面选择“后端服务器”页签,检查该后端服务器集群中的节点是否都在线,如果都下线会报此错误。 父主题: SLB同步异常相关问题
配置服务授权 购买运营中心后,系统将自动识别并弹框提示进行服务授权,同意服务授权后,AppStage将在统一身份认证服务IAM中为账号创建名称为appstage_admin_agency的委托。
表1 计费项说明 套餐包类型 说明 计费项 推理单元包周期 将基础或者预训练后的模型部署为在线服务时使用的算力单元,通过购买更多推理单元实现服务QPS扩容。
在“在线优化”页面,参照表2进行参数配置。 表2 提示语在线优化参数说明 参数名称 参数说明 变量标识符 可选择以下符号标识提示语内容中的变量。
配置服务授权 购买运维中心后,系统将自动识别并弹框提示进行服务授权,同意服务授权后,AppStage将在统一身份认证服务IAM中为账号创建名称为appstage_admin_agency的委托。
配置服务授权 购买运行时引擎后,系统将自动识别并弹框提示进行服务授权,同意服务授权后,AppStage将在统一身份认证服务IAM中为账号创建名称为appstage_admin_agency的委托。
知识库 知识库是面向开发团队的知识管理系统,支持知识全生命周期管理,帮助您完成智能、安全的知识作业,提供层级式的目录树、多人在线协同编辑等功能。
按需计费资源 对于按需计费模式的资源,例如按需计费的百川开源13B大模型服务API在线调用等,若不再使用这些资源且需停止计费,请删除相应资源。 退订包年包月资源以停止计费 登录AppStage管理控制台,默认进入应用平台管理控制台“总览”页。
在线压测 选择是否开启在线压测。 慢查询阈值 超过慢查询阈值的记录为慢sql,默认值为2000。 请求路由优化 是否开启请求路由优化。开启请求路由优化,可使请求优先访问有数据的节点,减少转发。 PK黑名单 选择是否开启PK黑名单。 单击“新增”,新增一条黑名单配置。
步骤三:部署模型 部署模型是将模型部署为在线服务,通过创建推理服务实现,创建成功后,可以对在线服务可以进行预测和调用。本文需要为基座模型(原模型)和微调后的新模型分别创建模型服务。由于在线运行需消耗资源,请确保账户未欠费。
部署大模型 鼠标移至大模型卡片并单击“部署”,进入“创建推理服务”页面,参见创建部署服务将模型部署为在线服务,对在线服务进行预测和调用。 说明: 需要具备AI原生应用引擎管理员或开发者权限,才能执行此操作。
购买AI原生应用引擎、运维中心或运营中心之后,系统将自动识别到您未同意服务授权并弹框提示您进行服务授权。 配置开发中心服务授权 关联CodeArts 关联后不支持修改关联关系,请谨慎操作。 登录AppStage控制台。
购买AI原生应用引擎、运维中心或运营中心之后,系统将自动识别到您未同意服务授权并弹框提示您进行服务授权。 配置开发中心服务授权 关联CodeArts 关联后不支持修改关联关系,请谨慎操作。 登录AppStage控制台。
使用在线构建图表卡片。 在运营中心控制台左侧导航栏选择“看板管理 > 我的卡片”。 在“我的卡片”页面中,选择卡片分类,单击“新建卡片”。 选择卡片创建方式。在“创建方式”下单击“在线构建”。 在左侧“组件库”下,拖拽组件至中间画布中。 在左侧“图层”下,为组件设置显示效果。
个指标 运营中心指标管理增强包 运营中心数智化大屏增强包 适用AI原生应用引擎如下计费项: 问答AI服务基础版(大模型调用token数、用户数) 问答AI服务专业版(大模型调用token数、用户数) 推理单元包周期(推理单元数) 适用AI原生应用引擎如下计费项: 大模型微调服务API在线调用
提供业务运行时管理,支持业务优雅启停、启动加速、在线诊断等能力。 提供流量控制、资源动态伸缩、容错容灾等能力,使能业务具备韧性。 提供云原生中间件与数据库管理,结合华为面向10亿+移动用户应用治理经验,兼具高并发与高可靠能力。
表2 字段映射 参数 说明 模型显示名 在数据分析或监控系统中显示的模型名称,通常是一个更易于理解和识别的字符串。 源表 指需要从中抽取数据的源数据表。选择源表后,单击源表后面的,可添加引用表,如表3所示。 字段映射 指将源表和引用表中的字段,与模板字段进行映射。
它通常是一串字符,用于识别调用API的应用程序和开发者。 获取API Key 以管理员身份登录AI原生应用引擎工作台,参考创建API Key获取。
如果主机的OpsAgent状态为“在线”,表示已安装成功。 如果主机的OpsAgent状态为“失败”,表示未安装成功,可以在“OpsAgent任务”页面,查看安装任务日志。 步骤三:分配主机 在“未纳管主机”页面,勾选待纳管的主机,单击“主机分配”。