检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
urces.yaml引用,文件名称可自定义。 spec文件夹:同一个服务在不同用途环境下所需配置文件(基础设施)。这个文件目录是必须的。 specs是在环境上部署服务时,最终使用的配置文件,当部署服务时,第一关注点和入口就是specs。 specs目录下的规格文件夹,命名采用站点级Cloud
选择“SLB节点信息”页签,单击“编辑”。 单击“新增节点”,配置IP和主机名。 IP为SLB所部署的服务器的私网地址。 自管理模式模式SLB,在Appstage运维中心主机管理服务中,选择“主机列表 > 弹性云服务器”,查看IP地址和主机名称。 单击“保存”。 创建监听。 选择左侧导航栏的“负载均衡
在右侧配置“卡片属性”,包括“基本信息”、“交互”和“属性”,具体的参数说明如表6 参数说明所示。 表3 参数说明 参数 说明 基本信息 基础信息 卡片的基本信息,不可修改。 交互 交互方式 无:无交互方式。 联动:一个区域可有多张卡片,可设置切换。 局部事件:当打开局部事件
不涉及。 取值范围: 介于-2.0和2.0之间。 默认取值: 0。 logit_bias 否 Map<String,Integer> 参数解释: 该参数接受一个JSON对象,将标记映射到从-100(禁止)到100(独占选择标记)的关联偏差值。 像-1和1这样的适度值将以较小的程度改变选择标记的概率。
考用户角色和权限说明。 创建产品信息 登录AppStage业务控制台。 在AppStage业务控制台右上角选择“产品与服务 > 产品管理”。 在“产品管理”页面右上角单击“创建产品”。 在“创建产品”页面的“产品归属部门”下拉列表中选择产品归属的部门,设置产品中文名和产品英文名,
已获取基础运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 已创建VPC和子网,具体操作请参见创建虚拟私有云和子网。 已配置服务环境。 约束限制 当前仅部分区域的VPC支持接入AppStage运维中心,包括华北-北京四、华南-广州、华东-上海一、华东-上海二和华北-乌兰察布一 ,如需接入其他区域的VPC,请联系技术支持工程师。
ModelRouter 实例化 表1 实例化参数 参数名 参数类型 是否必选 参数描述 base_url str False 模型网关开放的ip和端口,有默认值可以不填。功能类似OpenAI的base_url。 custom_hearders dict False 其他自定义请求头信息。
AppStage服务计费模式概述 AppStage提供包年/包月和按需计费两种计费模式,以满足不同场景下的用户需求。 包年/包月:一种预付费模式,即先付费再使用,按照订单的购买周期进行结算。购买周期越长,享受的折扣越大。一般适用于设备需求量长期稳定的成熟业务。 按需计费:一种后付
添加团队成员 在团队多人员协作开发过程中,不同角色成员执行各自权限和责任事项,因此需要在团队中添加协作开发的各角色成员(如项目经理、开发人员、测试人员等);当团队中成员发生岗位变动或人员流动时,也可进行相应修改或删除,实现统一有序的成员信息管理。 前提条件 已创建团队。 已添加开
为AppStage开发中心开发团队添加成员 在团队多人员协作开发过程中,不同角色成员执行各自权限和责任事项,因此需要在团队中添加协作开发的各角色成员(如项目经理、开发人员、测试人员等);当团队中成员发生岗位变动或人员流动时,也可进行相应修改或删除,实现统一有序的成员信息管理。 前提条件
确定。建议该参数和“多样性”只设置1个。 多样性 影响输出文本的多样性,取值越大,生成文本的多样性越强。建议该参数和“温度”只设置1个。 存在惩罚 介于-2.0和2.0之间的数字。正值会尽量避免重复已经使用过的词语,更倾向于生成新词语。 频率惩罚 介于-2.0和2.0之间的数字。
发布到对应的部署平台。 前提条件 需要具备项目经理、开发人员或测试人员角色权限,权限申请方法请参见申请权限。具体角色权限说明请参考用户角色和权限说明。 发布软件包到运维中心前,需要在运维中心录入并绑定镜像仓,否则会发布失败,具体操作请参见管理SWR。 版本基线化 由项目经理或开发
应用平台运维中心提供了一站式智能化运维平台,助力企业提升运维质量、效率与可靠性。您可以将公有云已创建的资源纳管至运维中心进行统一管理。 前提条件 已创建VPC和子网,具体操作请参见创建虚拟私有云和子网。 已购买主机,具体操作请参见购买弹性云服务器ECS或购买裸金属服务器BMS。 已购买数据库实例,具
平台在资产中心预置了提示语模板,同时也支持用户根据需求自定义创建提示语。在模型调测时引用创建的提示语模板,可以快速推进引导对话的发展,或者增加故事的复杂性和深度。大模型会基于提示语所提供的信息,生成对应的文本或者图片。 前提条件 需要具备AI原生应用引擎管理员或开发者权限,权限申请操作请参见AppStage组织成员申请权限。
ers-job-exec-controller 100m 500m 500Mi 2Gi kuberbacproxy 60m 100m 50Mi 100Mi 监控插件 cluster-monitoring ers-monitoring prometheus-operator 1 prometheus-operator
确定。建议该参数和“多样性”只设置1个。 多样性 影响输出文本的多样性,取值越大,生成文本的多样性越强。建议该参数和“温度”只设置1个。 存在惩罚 介于-2.0和2.0之间的数字。正值会尽量避免重复已经使用过的词语,更倾向于生成新词语。 频率惩罚 介于-2.0和2.0之间的数字。
取值范围: 可以为空,为空则使用默认值。枚举值:VECTOR_RAG(向量RAG,是一种结合了向量化和大语言模型的RAG技术)、GRAPH_RAG(知识图谱RAG,是一种结合了知识图谱和大语言模型的RAG技术)。 默认取值: VECTOR_RAG。 retrieval_config 否
Adaptation)是一种轻量级大模型微调技术,通过低秩矩阵分解技术显著减少了微调所需的参数,降低了微调过程中所需的存储和计算资源,可灵活地运用于不同的预训练模型和任务。 微调后名称 自定义模型微调后的新名称。支持英文、数字、中划线(-)、下划线(_),长度1-64个字符,仅支持字母或下划线开头。
工具页签下展示平台预置的第三方工具及租户上架的工具。 平台预置的第三方工具 请参考调用资产中心工具前设置认证鉴权设置鉴权,再进行调用。 租户上架的工具 请参考收藏上架的工具和调用资产中心工具前设置认证鉴权进行收藏及鉴权,再进行调用。 大模型 大模型页签下展示平台预置的大模型和平台接入的第三方模型服务。 平台预置的开源模型
表1 创建证书参数说明 参数 说明 证书录入方式 手动录入。 所属服务 证书所属的服务。 证书名称 填写证书名称。 证书名称在监听配置和极简网络管理台中关联显示,字符长度1~128,可以由字母、数字、短横线、点组成,不能包含特殊字符,不能包含-in-字符,不能以.key、.pem、