检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
轮询:支持按照服务实例的位置信息顺序路由。 响应时间权值:提供最小活跃数(时延)的权重路由,支持业务处理慢的服务实例接收较少的请求,防止系统停止响应。这种负载均衡策略适合请求量少且稳定的应用。 会话粘滞:会话粘滞是负载均衡器上的一种机制,在设定的会话保持时间内,会保证同一用户相关联的访问请求会被分配到同一实例上。
在上传页面单击“上传附件”,上传包文件,上传后会根据包文件中定义的内容,显示其他参数信息,确认无误后单击“确定”。 软件包及部署包最大支持上传150MB的文件,SQL包最大支持上传6MB的文件,IaC3.0包最大支持上传8MB的文件,TF模板包最大支持上传180MB的文件。 请选择正确的包类型,否则会导致上传失败。
操作场景 本文通过调用一系列知识中心的API,介绍从零开始创建知识库并进行检索的基本流程。API调用方法请参见如何调用API。 前提条件 准备一篇名为“问题.txt”的文档,文档内容为: “什么是量子计算?它是一种利用量子力学原理进行信息处理的计算方式。==== 什么是RAG?它
代码检查任务名称,可自定义。 仓库 选择需要检查的代码仓库。 分支 填写需要检查的仓库分支名称。 检查语言 选择需要检查的代码语言。 返回5的“任务配置”页面,在“请选择需要调用的任务”下拉列表中选择已配置完成的代码检查任务,“仓库”下拉列表选择创建代码仓库中已创建的仓库,其他参数无需配置,保持默认即可。
代码检查任务名称,可自定义。 仓库 选择需要检查的代码仓库。 分支 填写需要检查的仓库分支名称。 检查语言 选择需要检查的代码语言。 返回5的“任务配置”页面,在“请选择需要调用的任务”下拉列表中选择已配置完成的代码检查任务,“仓库”下拉列表选择创建代码仓库中已创建的仓库,其他参数无需配置,保持默认即可。
AppStage租户需要在华为云上已购买OBS桶(用于存放流水线编译构建的产物),具体操作方法请参见创建桶。 创建流水线 在开发中心首页下方的“我的团队”区域,选择需要操作的团队卡片,进入该团队空间。 如果该团队关联多个服务,可在顶部切换团队关联的其他服务。也可在顶部切换其他团队。 在左侧导航栏选择“流水线管理”。
表5 管理我接入的模型服务 操作 说明 取消发布模型服务 在模型列表“操作”列单击“取消发布”。 模型调测 在“我接入的”页签的服务列表中,单击“操作”列“模型调测”。 参照调测模型的步骤,完成模型测试。 修改模型服务 在“我接入的”页签的服务列表中,选择“操作”列的“更多 > 修改”。
依赖服务声明主要指的是在微服务之间建立的一种明确、显式的依赖关系描述,有助于理解和维护微服务之间的交互和依赖关系,以确保系统的稳定性和可维护性。 查看依赖服务(声明) 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“微服务开发 > 服务发现”。 选择左侧导航栏的“服务目录 > 一方服务”。
依赖服务声明主要指的是在微服务之间建立的一种明确、显式的依赖关系描述,有助于理解和维护微服务之间的交互和依赖关系,以确保系统的稳定性和可维护性。 查看依赖服务(声明) 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“微服务开发 > 服务发现”。 选择左侧导航栏的“服务目录 > 一方服务”。
例如虚拟机所在区域为华北-北京四,那么对应的项目名称为cn-north-4,具体可以在华为云控制台,鼠标悬停在右上角的用户名,选择下拉列表中的“我的凭证”,在项目列表中查看,如图1所示。 图1 区域与项目 projectId 根据选择的domainId和区域,默认显示所属的项目ID。 镜像仓地址 输入镜像仓地址。
申请资源 应用部署需要使用虚拟机、CCE、数据库等相关资源,本章节介绍如何申请资源。 AppStage支持两种资源申请方式:通过IaC声明式申请资源、通过控制台申请资源。 通过IaC声明式申请资源 运维中心部署服务,可以使用代码包部署应用,可以通过在代码中定义相关信息,完成资源申请。
start_time String 参数解释: 本次调用的开始时间。 取值范围: UTC格式的日期。 end_time String 参数解释: 本次调用的结束时间。 取值范围: UTC格式的日期。 cost Number 参数解释: 本次调用的总耗时,单位为毫秒。 取值范围: 正整数。 status
该参数接受一个JSON对象,将标记映射到从-100(禁止)到100(独占选择标记)的关联偏差值。 像-1和1这样的适度值将以较小的程度改变选择标记的概率。 使用logit_bias参数时,偏差被添加到模型生成的logits之前进行抽样。 约束限制: 不涉及。 取值范围: 不涉及。 默认取值:
引擎自动按照名称进行分配,并完成检索流的调用。 具体结构请参照本接口的请求实例。 约束限制: 不涉及 响应参数 状态码: 200 表4 响应Body参数 参数 参数类型 描述 responseBody String 参数解释: 流执行结果的内容。 取值范围: 不涉及。 responseHeaders
ppStage的开发中心、运维中心等各个中心。 添加开发中心用户:开发中心的用户数根据购买规格有相应的用户数量限制,组织管理员通过用户的添加或删除来合理管理开发中心的使用人员。 创建团队:在开发中心进行服务开发前,需要组织管理员先创建一个团队,将团队关联需要开发的服务。 配置服务
形式的不需要配置,公网域名解析的也不需要配置。 ipAddr 域名映射的地址,域名解析时,会将hostName解析成ipAddr。 灰度策略 实例的灰度规则,用于实现实例的灰度切换或者实例的访问权限控制。 健康检查参数 实例地址的健康检查,SDK侧可以配置健康检查,对实例的状态进行探测。
引擎自动按照名称进行分配,并完成工作流的调用。 具体结构请参照本接口的请求实例。 约束限制: 不涉及。 响应参数 状态码: 200 表4 响应Body参数 参数 参数类型 描述 responseBody String 参数解释: 流执行结果的内容。 取值范围: 不涉及。 responseHeaders
形式的不需要配置,公网域名解析的也不需要配置。 ipAddr 域名映射的地址,域名解析时,会将hostName解析成ipAddr。 灰度策略 实例的灰度规则,用于实现实例的灰度切换或者实例的访问权限控制。 健康检查参数 实例地址的健康检查,SDK侧可以配置健康检查,对实例的状态进行探测。
登录AI原生应用引擎,在左侧导航栏选择“模型中心 > 我的模型服务”,选择“我部署的”页签,在模型服务列表中复制模型服务调用ID。 3.租户接入模型服务 登录AI原生应用引擎,在左侧导航栏选择“模型中心 > 我的模型服务”,选择“我接入的”页签,在模型服务列表中复制模型服务调用ID。 约束限制:
用程序提供灵活的扩展和定制功能,支持使用Lua脚本扩展Nginx的功能,Lua信息通过IaC配置,Lua定制的点在SLB管理台展示。 查看lua配置 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“微服务开发 > 负载均衡”。 选择左侧导航栏的“实例管理”。