检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
选择左侧导航栏的“软件仓库 > 软件包管理”。 默认显示包类型为“软件包”的包信息,可以上传软件包。 单击“上传”。 在上传页面单击“上传附件”,上传包文件,上传后会根据包文件中定义的内容,显示其他参数信息,确认无误后单击“确定”。 软件包最大支持上传150MB的文件。 请选择正确的包类型,否则会导致上传失败。
化和大语言模型的RAG技术。VectorRAG将非结构化的数据转化为结构化的向量空间,利用向量库实现高效的信息检索。 GraphRAG:知识图谱RAG,是一种结合了知识图谱和大语言模型的RAG技术。GraphRAG能够处理各种类型的文档,从中提取实体(文档中具体的对象或概念)、关
在SLB中进行降级配置 降级配置是在业务高峰期时,需要临时减少对于目标服务的访问,达到降低目标服务负载;或者屏蔽对于非关键服务的访问,保持本服务的核心处理能力的治理措施。降级执行流程如图1所示。 图1 降级执行流程 前提条件 需要具备AppStage服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。
限。 操作步骤 在开发中心首页下方的“我的团队”区域,选择需要操作的团队卡片,进入该团队空间。 如果该团队关联多个服务,可在顶部切换团队关联的其他服务。也可在顶部切换其他团队。 在左侧导航栏选择“测试”。 选择需要的测试功能进行操作,测试功能的详细介绍如表1所示。 表1 测试功能说明
在SLB中进行降级配置 降级配置是在业务高峰期时,需要临时减少对于目标服务的访问,达到降低目标服务负载;或者屏蔽对于非关键服务的访问,保持本服务的核心处理能力的治理措施。降级执行流程如图1所示。 图1 降级执行流程 前提条件 需要具备AppStage服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。
参数说明 站点 选择需要纳管集群的站点。 部门 默认显示当前服务所属的租户名称,不可修改。 产品 默认显示当前服务所属的产品英文名,不可修改。 服务 默认显示当前服务的服务英文名,不可修改。 环境 选择需要纳管集群的环境。 集群 在下拉列表选择需要纳管的集群,下拉列表所展示集群为所选环境下华为公有云账号拥有的集群。
除终端节点。 查看VPC的归属服务 在已纳管的VPC列表中,单击待查看归属服务的VPC所在行“归属服务”列的“查看”,即可查看通过资源分配为VPC分配的服务。 删除VPC的归属服务 在已纳管的VPC列表中,单击待删除归属服务的VPC所在行“归属服务”列的“查看”。 在“资源分配列
部署计划时间 选择部署的计划开始时间和计划结束时间。 审批人 一级审批人/二级审批人/三级审批人 根据选择的变更等级及设置的审批层级,输入对应的审批人。 组织管理员可以修改一级审批人、二级审批人、三级审批人的角色名称,可自定义修改,如已修改角色名称,此处显示修改后的角色名称,如“一级审批人(技术评审)”。
将基础或者预训练后的模型部署为在线服务时使用的算力单元,通过购买推理单元实现服务QPS扩容。 包年/包月 包年/包月:实例数量*实例单价*购买时长 大模型调用 大模型调用次数。 包年/包月:与“应用并发用户数”一起构成套餐包。 按小、中、大规格计费。 应用并发用户数 同时访问应用的用户数。
Mppdb数据表 选择已创建的Mppdb数据表,具体操作请参考创建数据表。 步骤三:配置基础数据 在异常检测任务列表,单击任务所在行“操作”列的“基础”。 在基础配置页面,默认显示新增任务时配置的信息,单击“字段配置”,切换至“字段配置”页签。 配置对应的参数,配置完成后,单击“确认”。
包年/包月是一种先付费再使用的计费模式,适用于对资源需求稳定且希望降低成本的用户。通过选择包年/包月的计费模式,您可以预先购买云服务资源并获得一定程度的价格优惠。本文将介绍包年/包月AppStage套餐包的计费规则。 适用场景 包年/包月计费模式需要用户预先支付一定时长的费用,适用于长期、稳定的业务需
大语言模型的回答,大语言模型完整生成回答后一次性返回。 流式:调用大语言模型推理服务时,根据用户问题,获取大语言模型的回答,逐个字词的快速返回模式,不需等待大语言模型生成完成。 输出最大token数 表示模型输出的最大长度。 温度 较高的数值会使输出更加随机,而较低的数值会使其更
是告警中状态且未被清除和屏蔽的告警。 屏蔽告警 告警进入系统后被设置的屏蔽规则自动屏蔽或者人为在界面上手动单击屏蔽的告警。屏蔽的告警分为两种,一种是有具体屏蔽时间的,到了屏蔽时间结束后会作为一条新的告警再次出现在当前告警的列表中,一种是没有屏蔽时间的,将会被永久屏蔽。 历史告警
任务流程的细化分解是一种有效策略,能够简化系统架构,并降低对大语言模型能力的过度依赖。通过将繁复的工作拆解为一系列独立节点,不仅增强了复杂任务处理的效率,还在很大程度上提升了整个系统的透明度、鲁棒性和错误容忍度。这种方法使得LLM的应用范围得以扩大,即便面对高度复杂的任务也能表现出色。
d为申请的令牌ID,password为申请的令牌,添加完成后单击“保存”。 新建页面:选择“新建页面”,可以创建页面或分类,分类是对页面的分组,页面类型说明如表1所示,参数配置完成后单击“确定”。 表1 页面类型说明 页面类型 说明 瀑布流页面 最常用的页面类型,即常见的报表页面。
表5 管理我接入的模型服务 操作 说明 取消发布模型服务 在模型列表“操作”列单击“取消发布”。 模型调测 在“我接入的”页签的服务列表中,单击“操作”列“模型调测”。 参照调测模型的步骤,完成模型测试。 修改模型服务 在“我接入的”页签的服务列表中,选择“操作”列的“更多 > 修改”。
使用数据源的鉴权方式,只有通过对应业务的token的鉴权,才能使用对应数据源。 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)” 选择左侧导航栏的“监控 > 报表开发”。 创建报表。 单击左下角的“设置和帮助
添加到分类 可以选择无分类,或者已新增的分类。 页面类型 选择需要创建的页面类型。 瀑布流页面:最常用的页面类型,即常见的报表页面。 自由布局页面:支持创建自由布局页面。 页面跳转:日志检索常用类型,需要设置一个url地址。 轮播页面:轮播大屏,可以将已创建的页面进行轮播。需要设置轮播间隔,并在轮播页面选择已创建页面。
提供AI原生应用开发引擎,包括RAG、Agent等应用框架,零码态和全码态的开发形态,降低AI原生应用开发门槛、提升开发效率。支持客户打通自己的业务能力API,将大模型的能力结合进入自己的业务链路。 提供支撑AI原生应用运行的整套模型工具链,包括数据管理、模型接入、模型调优、知识工程等能力
当前仅部分区域的主机支持接入AppStage运维中心,包括华北-北京四、华南-广州、华东-上海一、华东-上海二和华北-乌兰察布一 ,如需接入其他区域的主机,请联系技术支持工程师。 支持接入的主机操作系统如表1所示,其余类型的主机无法接入AppStage运维中心。 表1 支持的主机操作系统