检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
支持将平台资产中心的部分模型作为微调前基础模型,也支持选择微调后的新模型作为基础模型再次进行微调。 前提条件 已订购大模型微调服务API在线调用-SFT局部调优,订购方法请参见购买AI原生应用引擎按需计费资源。 已具备格式为“对话文本”的微调数据集,具体请参考创建微调数据集或收藏预置微调数据集。
en。发布后,通过Token校验获取新的访问链接,使用新的访问链接查看此屏幕。Token校验方法请参考“Token校验”。 当屏幕中存在非在线构建的卡片,屏幕不能分享。 Token校验 客户端在使用Token校验的流程如下。 已获取大屏分享链接和Token。 例如,分享链接https://console
创建及管理Agent 模型中心 模型中心是集中管理用户微调后的模型、模型微调流水线(即模型微调任务),以及调测模型。 支持区域: 华北-北京四 创建及管理模型 创建模型微调流水线 调测模型 查看模型调用记录 知识中心 数据是模型训练(含数据标注)以及知识库的基础,在整个模型、知识库中起
说明 上下线微服务实例 在实例列表中,单击操作列的“上线”或“下线”,具体介绍请参见调整微服务实例状态。 设置微服务实例为拨测状态 在实例列表中,单击操作列的“拨测”。 添加实例标签 在实例列表中,单击操作列的“标签管理”。 父主题: 查看和管理注册到CloudMap的微服务实例
说明 上下线微服务实例 在实例列表中,单击操作列的“上线”或“下线”,具体介绍请参见调整微服务实例状态。 设置微服务实例为拨测状态 在实例列表中,单击操作列的“拨测”。 添加实例标签 在实例列表中,单击操作列的“标签管理”。 父主题: 查看和管理注册到CloudMap的微服务实例
在“云服务器管理 > 未纳管主机”页面,可以通过OpsAgent状态判断主机OpsAgent是否安装成功。 如果主机的OpsAgent状态为“在线”,表示已安装成功。 如果主机的OpsAgent状态为“失败”,表示未安装成功,可以在“任务管理 > OpsAgent任务”页面,查看安装任务日志。
超出流控值,则触发限流,用户的请求会因为流控而失败。 无限制 10次/秒 50次/秒 100次/秒 200次/秒 在模型调测区域调测模型。 调测文本对话类型模型,请参考表3配置参数。 表3 文本对话类型模型调测参数说明 参数名称 参数说明 输出方式 可选非流式、流式。二者区别如下: 非流式:调用大语言模型
模型调测时,无法选择模型服务商API是什么原因? 对模型服务商API调测前,需要先设置鉴权,具体操作请参见如何对模型供应商提供的模型服务设置鉴权。 父主题: AI原生应用引擎
设规则自动化执行流程,从而提高工作效率和准确性。 ClickHouse ClickHouse是一个开源的分布式列式数据库管理系统,主要用于在线分析处理(OLAP)场景。它具有高性能、高可靠性、高可扩展性等特点,可以处理海量数据,支持复杂的查询和数据分析操作。ClickHouse支
型展示不同的数据看板,可视化展现产品运营现状。 使用在线构建图表卡片。 在运营中心左侧导航栏选择“看板管理 > 我的卡片”。 在“我的卡片”页面中,选择卡片分类,单击“新建卡片”。 选择卡片创建方式。在“创建方式”下单击“在线构建”。 在左侧“组件库”下,拖拽组件至中间画布中。 在左侧“图层”下,为组件设置显示效果。
如何对平台接入的第三方模型服务设置鉴权 平台资产中心接入了第三方供应商的闭源模型,例如GLM系列、Moonshot系列等,这些模型服务在调测(体验)、调用前,需要先设置模型鉴权。 前提条件 需要具备AI原生应用引擎管理员权限,权限申请操作请参见AppStage组织成员申请权限。 操作步骤
体验Agent Agent体验是指以对话的形式,对自创建的Agent或平台资产中心预置的AI应用进行体验调测,以发现并解决Agent接口上的问题和错误。 体验我的Agent 在AI原生应用引擎的左侧导航栏选择“Agent编排中心 > 我的Agent”。 选择“我创建的”页签,单击Agent列表“操作”列的“体验”。
平台支持从多个维度对模型的能力、性能进行评估,以保证模型效果,为模型选型提供可靠依据。 约束与限制 仅支持对文本对话类型的模型服务进行评测。 前提条件 评测模型前,请先通过调测/体验模型功能确认模型可用。 创建评测任务 在AI原生应用引擎的左侧导航栏选择“模型中心 > 模型评测”,单击“创建评测任务”。 在“创建评测任务”弹框中选择“通用维度评测”。
模型重试次数 路由策略中单个模型服务的重试次数,取值范围为0-100次。 策略描述 路由策略的描述信息。 在模型调测区域,参考表2调测模型。 表2 模型调测参数说明 参数名称 参数说明 输出方式 可选非流式、流式。二者区别如下: 非流式:调用大语言模型推理服务时,根据用户问题
设规则自动化执行流程,从而提高工作效率和准确性。 ClickHouse ClickHouse是一个开源的分布式列式数据库管理系统,主要用于在线分析处理(OLAP)场景。它具有高性能、高可靠性、高可扩展性等特点,可以处理海量数据,支持复杂的查询和数据分析操作。ClickHouse支
主机分配。勾选需要分配的主机,单击“主机分配”,如图3所示。 可以在列表上方筛选需要分配的主机类型,及主机OpsAgent状态,仅支持将OpsAgent状态为在线的主机进行分配。 如果主机的OpsAgent状态为“失败”,表示未安装成功,可以在主机管理服务“任务管理 > OpsAgent任务”页面,查看安装任务日志。
请参考表1配置起始节点参数,配置完成后可以单击“设置参数”,对当前节点进行正确性测试。调测成功后,会将测试的输出数据(即样本数据)及输入数据进行展示,并会在该条节点的左上角标记图标。如果提示“调测失败,请检查接口参数配置是否准确”,请检查并重新配置参数后重试。 表1 起始节点配置参数说明
可以选择对应服务下单个或多个微服务。 告警指标 长时间拨测状态 大量实例下线 指标配置 当告警指标为长时间拨测状态时,配置存在实例持续X分钟拨测状态未更新,X范围:1~30,表示微服务实例注册到CloudMap后,如果某个实例或多个实例的状态变成了拨测状态,且状态持续时间超过了X分钟就会触发告警。
可以选择对应服务下单个或多个微服务。 告警指标 长时间拨测状态 大量实例下线 指标配置 当告警指标为长时间拨测状态时,配置存在实例持续X分钟拨测状态未更新,X范围:1~30,表示微服务实例注册到CloudMap后,如果某个实例或多个实例的状态变成了拨测状态,且状态持续时间超过了X分钟就会触发告警。
单击“设置参数”,输入参数,用于调测工作流。 (可选)单击其他后续节点,在界面参数配置面板中单击“调测节点”,对当前节点进行正确性测试。调测成功后,会将测试的输出数据(即样本数据)及输入数据进行展示,并会在该条节点的左上角标记图标。如果提示“调测失败,请检查接口参数配置是否准确”,请检查并重新配置参数后重试。