检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
模型微调任务一直在等待中是什么原因? 模型微调任务一直在“等待中”状态,表示当前平台资源规格紧张,任务需要进行排队,请耐心等待。 父主题: AI原生应用引擎
Pod。 虚拟机:适用于虚拟机部署DCS、DMQ、SLB、GaussDB等。 访问控制 选择访问控制类型。 安全组:使用安全组来控制网络互通策略,一般容器场景下使用。 ACL:使用网络ACL来控制网络互通策略,仅支持虚拟机场景下使用。 所属安全区域 选择所属安全区域,即隔离域被安全划
础;微调数据集是模型微调的基础,通过在微调数据集上进行训练,您可以获得改进后的新模型以适应特定任务。 模型管理 支持通过API接入模型服务,同时支持将平台预置模型进行微调后,部署为模型服务,为检验模型的准确性及反应效果,您可以通过调测模型能力进行体验调测,确保模型能够在实际应用中正常运行。
AI原生应用引擎管理员角色,可以查看工作空间、资产中心,可以管理我的模型、数据集与知识库、我的提示语,还可以创建访问密钥。 AI原生应用引擎开发者 AI原生应用引擎浏览者 组织管理员 AI原生应用引擎开发者 服务级 AI原生应用引擎开发者角色,可以查看工作空间、资产中心,可以管理我的模型、数据集与知识库、我的提示语,还可以创建访问密钥。
公有云ELB”,进入“公有云ELB”页面。 单击待创建监听器的ELB名称,进入ELB详情页面,默认显示“基本信息”页签。 单击“监听器”,切换至“监听器”页签。 在监听器列表中,单击待开启访问控制的监听器所在行“操作”列的“更多 > 访问控制”。 开启访问控制按钮,并输入允许访问的白名单IP,如果输
的形式表示出来,推理机则用于实现推理过程,推理策略则用于指导推理机的搜索和推理方向。 大语言模型 大语言模型是一种能够理解和生成人类语言的人工智能模型。这些模型通常使用大量的数据进行训练,以便它们能够识别语言中的模式和规律。大语言模型的应用范围非常广泛,包括自然语言处理、机器翻译、语音识别、智能问答等领域。
单击输入框右侧的“引用模板”选择我创建的、我收藏的或平台预置的提示语模板。 推理模型 将提示语应用于我创建的、平台预置的或第三方模型服务中,预览推理结果。 选择推理模型后,可配置推理模型的相关参数,如表2所示。 表2 推理模型参数配置说明 参数名称 参数说明 最大token数 影响推理返回内容的最大长度,取值范围:1-10000。
新增访客数计算模板 模板介绍 新增访客数计算模板是用来统计指定时间内,网站或应用程序的新增访客数。 图1 新增访客数计算模板 指标体系 表1 指标体系 指标名称 指标描述 新增访客数日新增 指每日新增访客数。 新增访客数周新增 指每周新增访客数。 新增访客数月新增 指每月新增访客数。
的形式表示出来,推理机则用于实现推理过程,推理策略则用于指导推理机的搜索和推理方向。 大语言模型 大语言模型是一种能够理解和生成人类语言的人工智能模型。这些模型通常使用大量的数据进行训练,以便它们能够识别语言中的模式和规律。大语言模型的应用范围非常广泛,包括自然语言处理、机器翻译、语音识别、智能问答等领域。
问题现象 图1 Agent报错 解决方法 检查创建Agent时选择的模型是否为模型服务商API,使用模型服务商API时,需要配置模型服务鉴权,新开的租户没有配置模型鉴权,具体操作请参见如何对模型供应商提供的模型服务设置鉴权。 父主题: AI原生应用引擎
我创建的微调数据集会被其他用户调用去训练他们的大模型吗? 用户个人创建的数据集是属于个人账号下的专属数据,未经本人许可不会被其他人员查看到,且不会被其他用户在大模型训练时调用。 父主题: AI原生应用引擎
Agent问答的时候没有回答 思考模型没有配置鉴权,或者鉴权失效了,可以通过模型调测功能测试思考模型是否正常,具体操作请参见调测/体验模型。 父主题: AI原生应用引擎
为微服务配置告警策略 支持对某个服务下的单个微服务或者多个微服务配置告警策略,告警信息会进行上报,业务可在监控服务(ServiceInsight)管理台上查看告警信息。 前提条件 需要具备AppStage服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 新增告警配置
为微服务配置告警策略 支持对某个服务下的单个微服务或者多个微服务配置告警策略,告警信息会进行上报,业务可在监控服务(ServiceInsight)管理台上查看告警信息。 前提条件 需要具备AppStage服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 新增告警配置
灰度服务依赖转发策略,一个转发策略实例可以对应多个灰度服务,1个灰度服务只能对应一个转发策略实例。 工作原理 客户端向应用程序发出请求。 负载均衡实例中的监听接收与配置的协议和端口匹配的请求。 监听再根据配置将请求转发至相应的后端服务器集群。如果配置了转发策略,监听会根据配置的
灰度服务依赖转发策略,一个转发策略实例可以对应多个灰度服务,1个灰度服务只能对应一个转发策略实例。 工作原理 客户端向应用程序发出请求。 负载均衡实例中的监听接收与配置的协议和端口匹配的请求。 监听再根据配置将请求转发至相应的后端服务器集群。如果配置了转发策略,监听会根据配置的
必填。要统计的指标的种类。 普通型指标 复合型指标 静态指标 数据模型 当指标类型为“普通型指标”和“静态指标”时,需要配置此参数。 选择已发布的数据模型,该参数的取值在“数据模型”页面配置。 计算方式 指标的计算方法。 仅当“指标类型”为“普通型指标”时,该参数显示,此时,“函数”为选填,“字段”为必填。
工作流的返回是json格式,但是大模型会进行总结,如何以json格式直接输出? 创建Agent配置工作流时,支持选择模式,选择为“总结模式”时,大模型会对工作流的输出进行总结;选择为“精确模式”时大模型不会总结,直接返回工作流的输出,如图1所示,具体介绍请参见创建并发布Agent。
、测试模型服务时需要调用ChatGLM3-6B大模型服务API在线调用、大模型微调服务API在线调用-SFT局部调优,按需计费模式能大幅降低客户的业务成本。 适用计费项 AI原生应用引擎的以下计费项支持按需计费。 表1 适用计费项 计费项 说明 ChatGLM3-6B大模型服务API在线调用
应用指标摸板库生成指标运行失败 问题描述 应用指标摸板库生成指标时,提示运行失败。 处理方法 检查选择的数据源和应用的模型是否匹配。模型对选择的数据是有要求的,数据源和模型之间不匹配,将导致指标运行失败。 父主题: 运营中心