检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
查看模型调用统计 模型调用统计页面展示当前租户所在的根部门以及租户下二级子部门的模型调用情况。 前提条件 需要具备AI原生应用引擎租户运营管理员权限,权限申请操作请参见AppStage组织成员申请权限。 查看模型调用统计 在AI原生应用引擎的左侧导航栏选择“运营看板 > 模型调用统计”。
温度 较高的数值会使输出更加随机,而较低的数值会使其更加集中和确定。建议该参数和“多样性”只设置1个。 多样性 影响输出文本的多样性,取值越大,生成文本的多样性越强。建议该参数和“温度”只设置1个。 存在惩罚 介于-2.0和2.0之间的数字。正值会尽量避免重复已经使用过的词语,更倾向于生成新词语。
定制的url。 如需配置,建议配置为以@olc_degrade开头的字符串,并在服务里准备同名转发策略,配置好响应。 为空时默认使用SLB设置的状态码403。 根据需要开启白名单列表及黑名单列表开关,关闭时规则不生效。 单击“保存”。 父主题: 在SLB中创建和管理负载均衡实例
AppStage运维中心支持接入虚拟机日志和容器日志,您可以根据日志类型选择日志接入方式。 虚拟机日志接入:通过日志配置下发任务部署filebeat,并根据日志采集配置设置,通过filebeat采集虚拟机上的业务日志。 容器日志接入:安装daemonset插件,通过daemonset实现容器日志接入。 (可选
定制的url。 如需配置,建议配置为以@olc_degrade开头的字符串,并在服务里准备同名转发策略,配置好响应。 为空时默认使用SLB设置的状态码403。 根据需要开启白名单列表及黑名单列表开关,关闭时规则不生效。 单击“保存”。 父主题: 创建和管理负载均衡实例
AI原生应用引擎基本概念 使用之前,请先了解表1中相关概念,从而更好的使用AI原生应用引擎。 表1 基本概念说明 基本概念 说明 Agent Agent指具备自主智能的实体,具有一定的智能和自主性,可以自主地发现问题、设定目标、构思策略、执行任务等。 LLM 大语言模型(Large
Bash客户端克隆代码 本节内容指导如何使用Git Bash客户端克隆代码托管服务的仓库到本地环境中。 下载并安装Git Bash客户端。 设置SSH密钥。 获取仓库地址。 在仓库主页中,单击“克隆/下载”按钮,获取SSH地址,通过这个地址,可以在本地计算机连接代码托管仓库。 如果
行审批。 变更时间 部署计划时间 选择部署的计划开始时间和计划结束时间。 审批人 一级审批人/二级审批人/三级审批人 根据选择的变更等级及设置的审批层级,输入对应的审批人。 组织管理员可以修改一级审批人、二级审批人、三级审批人的角色名称,可自定义修改,如已修改角色名称,此处显示修
在微服务平台查看微服务实例列表 通过微服务平台查看微服务的实例列表。 查看微服务实例列表 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“微服务开发 > 微服务平台”。 选择左侧导航栏的“微服务管理”。 选择微服务列表操作列的“更多 > 实例管理”,进入实例管理页面。
在微服务平台查看微服务实例列表 通过微服务平台查看微服务的实例列表。 查看微服务实例列表 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“微服务开发 > 微服务平台”。 选择左侧导航栏的“微服务管理”。 选择微服务列表操作列的“更多 > 实例管理”,进入实例管理页面。
(支持多选): 行业 适用领域 通用 配置部署模型参数,参数说明如表2所示。 表2 微调的模型部署参数说明 参数名称 参数说明 实例个数 设置模型服务部署的实例个数。 不同的模型部署1个实例需要的推理单元个数不同,比如,ChatGLM3-6B需要2个实例。 不同的模型因为模型参数
IaC压缩包。 └── package.json 文件 1 包描述文件,相关说明请参见包描述文件介绍。 └── global/ 文件夹 1 全局默认的IaC描述,包含完整文件结构,放置被所有规格目录所复用的配置文件。 │ └── meta.yaml 文件 1 变更策略描述,相关说明请参见在IaC代码中定义流水线。
SLB实例配置 本章介绍通过IaC进行SLB实例配置的管理,包括nginx.conf,url重写/重定向,内网段,降级,黑白名单,流控,其他配置以及自定义lua配置,对应的资源类型为WiseCloud::LoadBalancer::SLB::Config。 SLB实例配置 表1 SLB实例配置字段说明
列表操作列的“查看”,可以执行单个SQL文件。 在弹出窗中配置执行选项。执行选项说明如表1所示。配置完成后单击“确定”。 表1 执行SQL设置参数说明 参数 说明 并行执行 默认关闭,默认SQL变更任务下所有子任务都会串行执行,即执行完一个子任务后再执行下一个子任务,避免对数据库性能消耗过大。
RetrievalConfig 参数 是否必选 参数类型 描述 retrieval_modes 是 Array of strings 参数解释: 检索模式,用于设置知识库检索召回时的检索方式。 约束限制: 不涉及。 取值范围: 可传多个值。枚举值:SEMANTIC_RETRIEVAL(使用向量进行文本
列表操作列的“查看”,可以执行单个SQL文件。 在弹出窗中配置执行选项。执行选项说明如表1所示。配置完成后单击“确定”。 表1 执行SQL设置参数说明 参数 说明 并行执行 默认关闭,默认SQL变更任务下所有子任务都会串行执行,即执行完一个子任务后再执行下一个子任务,避免对数据库性能消耗过大。
标准发布”。 在“标准发布检查结果”列表中,不同类型的版本显示相应的检查项的检查规则、检查结论和检查结果,检查项数据来源于组织管理员在版本活动页面设置的标准发布准入配置。 检查项均检查通过后,可以单击“下一步”,进入“标准发布”页面,继续申请标准发布。 申请标准发布 可由开发人员、测试人员或项目经理提交版本标准发布申请。
标准发布”。 在“标准发布检查结果”列表中,不同类型的版本显示相应的检查项的检查规则、检查结论和检查结果,检查项数据来源于组织管理员在版本活动页面设置的标准发布准入配置,具体操作请参见管理版本标准发布准入配置。 检查项均检查通过后,可以单击“下一步”,进入“标准发布”页面,继续申请标准发布。
在版本详情页面的“版本持续交付”区域,选择“持续部署发布 > 调测发布”。 在“调测发布”页面单击“创建活动”,在“创建调测发布活动”页面,设置版本名称、备注(可选)。 调测发布的版本名称与标准发布的主版本名称前三段一致,仅需定义第四段编号,且第四段编号不能与标准发布的主版本名称第四段编号相同。
常用监控插件说明 cpu 插件类型 OS 功能说明 统计cpu信息,每次采集都为每个vcpu,以及总cpu维度分别生成消息。 原始数据来源:/proc/loadavg、/proc/stat等。 参数配置 插件默认为CPU0、CPU1、...、CPU-ALL分别生成消息。用户可根据