检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
基于NUWA微服务开发框架,预集成构建云服务业务分布式架构所需的各个组件及高可用能力,实现开箱即用。 提供业务运行时管理,支持业务优雅启停、启动加速、在线诊断等能力。 提供流量控制、资源动态伸缩、容错容灾等能力,使能业务具备韧性。 提供云原生中间件与数据库管理,结合华为面向10亿+移动用户应用治理经验,兼具高并发与高可靠能力。
ignore) { } } API Key认证 API Key全称为应用程序接口密钥,是一种用于验证和授权API请求的代码。它通常是一串字符,用于识别调用API的应用程序和开发者。 获取API Key 以管理员身份登录AI原生应用引擎工作台,参考创建API Key获取。 使用API Key鉴权
支持将平台资产中心预置的部分模型作为微调前基础模型,也可以选择微调后的新模型作为基础模型再次进行微调。 前提条件 已订购大模型微调服务API在线调用-SFT局部调优,订购方法请参见购买AI原生应用引擎按需计费资源。 已具备格式为“对话文本”的微调数据集,具体请参考创建微调数据集或收藏预置微调数据集。
开发中心/运维中心/运营中心计费项 计费说明 开发中心/运维中心/运营中心的计费项如表1所示。 表1 开发中心/运维中心/运营中心的计费项说明 套餐包类型 说明 计费项 适用的计费模式 计费公式 开发中心专业版 支持统一应用架构建模、产品/版本/个人级协作管理、一站式开发工具链、研发效能洞察、海量资产模板。
命令。 使用root账号远程登录主机后,执行安装命令安装OpsAgent。 安装完成后,未纳管主机列表中,该主机的OpsAgent状态为“在线”。 远程安装:选择虚拟私有云下已经安装了OpsAgent的主机作为安装机,安装机将作为中间桥梁安装OpsAgent到同虚拟私有云下的其他主机。
检索规划包含“Query拆解”、“Query改写”、“意图识别”三个执行动作,执行动作参数配置说明如表1所示。 Query拆解:配置适当的模型将原始查询内容拆解为更简单、易理解的请求。 Query改写:配置适当的模型对原始查询内容进行改写、优化,使得原始请求更准确。 意图识别:配置适当的模型对原始内容进行意图判断。
在SLB中进行降级配置 降级配置是在业务高峰期时,需要临时减少对于目标服务的访问,达到降低目标服务负载;或者屏蔽对于非关键服务的访问,保持本服务的核心处理能力的治理措施。降级执行流程如图1所示。 图1 降级执行流程 前提条件 需要具备AppStage服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。
在“上传文档”对话框,选择“交付方式”为“在线文档”,单击“创建文档”,进入文档编辑页面进行内容写作,文档内容将实时自动保存,创建在线文档成功。 如需更换文档交付方式,先删除此在线文档。删除文档后其全部内容将被清空,且内容将无法恢复,请谨慎操作。 (可选)如需更新在线文档,具体操作如下: 返回“
M3-6B大模型服务API在线调用、大模型微调服务API在线调用-SFT局部调优,按需计费模式能大幅降低客户的业务成本。 适用计费项 AI原生应用引擎的以下计费项支持按需计费。 表1 适用计费项 计费项 说明 ChatGLM3-6B大模型服务API在线调用 根据实际输入和输出tokens总量计费,平台提供算力支持。
运营中的重要数据,支撑下一步运营动作,提升产品运营效率。 功能介绍 提供丰富的卡片类型,供看板选用。卡片构建方式包括:使用在线构建方式构建图表卡片、使用在线构建方式构建表单卡片、使用模板构建方式新建卡片、使用离线构建方式新建卡片。 在看板编辑页面,通过拖拉拽的方式,以图表的形式进行呈现,直观展现产品运营看板数据。
ent安装。 在“未纳管主机”页面,可以通过OpsAgent状态判断主机OpsAgent是否安装成功。 如果主机的OpsAgent状态为“在线”,表示已安装成功。 如果主机的OpsAgent状态为“失败”,表示未安装成功,可以在“OpsAgent任务”页面,查看安装任务日志。 如
展示不同的数据看板,可视化展现产品运营现状。 使用在线构建图表卡片。 在运营中心控制台左侧导航栏选择“看板管理 > 我的卡片”。 在“我的卡片”页面中,选择卡片分类,单击“新建卡片”。 选择卡片创建方式。在“创建方式”下单击“在线构建”。 在左侧“组件库”下,拖拽组件至中间画布中。
微调任务执行完成后,单击“操作”列的“发布”,发布模型。 步骤三:部署模型 部署模型是将模型部署为在线服务,通过创建部署服务实现,创建成功后,可以对在线服务可以进行预测和调用。本文需要为基座模型(原模型)和微调后的新模型分别创建模型服务。由于在线运行需消耗资源,请确保账户未欠费。 在AI原生应用引擎的左侧导航栏选择“模型中心
SDK种子节点IP SDK种子节点IP信息。 实例种子节点IP 实例种子节点IP信息。 全表扫描 选择是否开启全表扫描。 在线压测 选择是否开启在线压测。 慢查询阈值 超过慢查询阈值的记录为慢sql,默认值为2000。 请求路由优化 是否开启请求路由优化。开启请求路由优化,可使请求优先访问有数据的节点,减少转发。
en。发布后,通过Token校验获取新的访问链接,使用新的访问链接查看此屏幕。Token校验方法请参考“Token校验”。 当屏幕中存在非在线构建的卡片,屏幕不能分享。 Token校验 客户端在使用Token校验的流程如下。 已获取大屏分享链接和Token。 例如,分享链接https://console
在“应用模板”页面,完成字段映射,如表2所示。 表2 字段映射 参数 说明 模型显示名 在数据分析或监控系统中显示的模型名称,通常是一个更易于理解和识别的字符串。 源表 指需要从中抽取数据的源数据表。选择源表后,单击源表后面的,可添加引用表,如表3所示。 字段映射 指将源表和引用表中的字段,与模板字段进行映射。
数据管理中纳管了用户自定义的和平台预置的数据集,用户使用这些数据集进行模型训练、知识库构建等,快速完成平台使用并验证模型训练效果。 模型管理 用户可以自定义创建模型、模型服务及在线测试模型,检验模型的准确性、可靠性及反应效果。 提示语管理 用户自定义创建的、收藏的以及平台预置的提示语模板进行优化和改进。 大模型微调
主机分配。勾选需要分配的主机,单击“主机分配”,如图3所示。 可以在列表上方筛选需要分配的主机类型,及主机OpsAgent状态,仅支持将OpsAgent状态为在线的主机进行分配。 图3 主机分配 如果主机的OpsAgent状态为“失败”,表示未安装成功,可以在主机管理服务“OpsAgent任务”页面,查看安装任务日志。
在“应用模板”页面,完成字段映射,如表2所示。 表2 字段映射 参数 说明 模型显示名 在数据分析或监控系统中显示的模型名称,通常是一个更易于理解和识别的字符串。 源表 指需要从中抽取数据的源数据表。选择源表后,单击源表后面的,可添加引用表,如表3所示。 字段映射 指将源表和引用表中的字段,与模板字段进行映射。
Req)服务中“缺陷(Bug)”相关的能力,缺陷管理严格把控缺陷提出、分析、修复、测试、验收、关闭的完整流程,提供跨项目的缺陷作业跟踪追溯能力,实时识别产品缺陷风险,为组织的产品交付质量提供保障。 前提条件 已关联CodeArts。 已创建版本。 已获取项目经理、开发人员或测试人员角色权限,权限申请方法请参见申请权限。