检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
查看Agent调用统计 Agent调用统计页面展示当前租户所在的根部门以及租户下二级子部门的Agent调用情况。 前提条件 需要具备AI原生应用引擎租户运营管理员权限,权限申请操作请参见AppStage组织成员申请权限。 查看模型调用统计 在AI原生应用引擎的左侧导航栏选择“运营看板 > Agent调用统计”。
查看模型调用统计 模型调用统计页面展示当前租户所在的根部门以及租户下二级子部门的模型调用情况。 前提条件 需要具备AI原生应用引擎租户运营管理员权限,权限申请操作请参见AppStage组织成员申请权限。 查看模型调用统计 在AI原生应用引擎的左侧导航栏选择“运营看板 > 模型调用统计”。
在快捷入口选择“运维中心”,进入运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 部署服务”。 选择左侧导航栏的“环境管理 > 服务环境管理”。 在环境列表中的环境名称,在环境详情页面查看组件列表中的状态。 当此次变更的所有组件状态都为“正常”时,表示变更任务执行成功。 验证业务进程是否正常启动 登录AppStage首页。
单击实例列表的所属ERS集群列,跳转到工作负载列表页面。 配置POD实例伸缩 在实例列表上方配置目标实例数,单击“保存”,在弹出的提示框中单击“确定”,即可进行实例扩缩容。 说明: 灰度期间,如果配置并打开了水平自动伸缩(HPA),则扩缩容的目标实例数需要介于HPA的[minReplicas
查看工作负载列表 单击实例列表的所属ERS集群列,跳转到工作负载列表页面。 配置POD实例伸缩 在实例列表上方配置目标实例数,单击“保存”,在弹出的提示框中单击“确定”,即可进行实例扩缩容。 灰度期间,如果配置并打开了水平自动伸缩(HPA),则扩缩容的目标实例数需要介于HPA的[minReplicas
使小幅度下降的异常不告警,针对阈值线过紧的情况,图1的异常通过敏感度调节不了,因为阈值线相对是合理的 配置count_threshold参数,如果不关注请求量很少的异常,可以配置该参数,建议非必要情况下不要配置该参数,可能会出现遗漏告警的情况。 毛刺告警 两三个显著的毛刺点异常,如图2所示。
行排序数:该指标用于统计该段时间内已排序的行数。 扫描表排序数:该指标用于统计该段时间内通过扫描表完成的排序数。 打开表缓存查找的命中数/未命中数 打开表缓存查找的命中数:该指标用于统计该段时间内打开表缓存查找的命中数。 打开表缓存查找的未命中数:该指标用于统计该段时间内打开表缓存查找的未命中数。 未关闭的长事务个数
OBS终端节点的获取方法如下: 获取已授予OBS桶读写权限的账号。对账号授予桶的读写权限的方法,请参见对其他账号授予桶的读写权限。 登录控制台,选择“存储 > 对象存储服务 OBS”,进入OBS控制台。 鼠标移动到指定桶所在行,在弹出的基本信息中,“Endpoint”参数值即为OBS终端节点。
行排序数:该指标用于统计该段时间内已排序的行数。 扫描表排序数:该指标用于统计该段时间内通过扫描表完成的排序数。 打开表缓存查找的命中数/未命中数 打开表缓存查找的命中数:该指标用于统计该段时间内打开表缓存查找的命中数。 打开表缓存查找的未命中数:该指标用于统计该段时间内打开表缓存查找的未命中数。 未关闭的长事务个数
禁用规则 在规则列表,单击待禁用的规则所在行“启用状态”列的,当显示为时,表示禁用成功。 规则禁用后将不可用。 编辑规则 在规则列表,单击待编辑规则所在行“操作”列的“编辑”。 删除规则 在规则列表,单击待删除规则所在行“操作”列的“删除”。 父主题: 使用EAP进行流程管理
grayStatus: 2 #微服务平台实例管理页面pod的灰度状态,1:生产;2:灰度 # 进入第2阶段(切占全网10%的流量到灰度节点),业务观察情况:10%的灰度流量引入灰度节点(2个),剩余流量还是引入生产节点(2个)
化和大语言模型的RAG技术。VectorRAG将非结构化的数据转化为结构化的向量空间,利用向量库实现高效的信息检索。 GraphRAG:知识图谱RAG,是一种结合了知识图谱和大语言模型的RAG技术。GraphRAG能够处理各种类型的文档,从中提取实体(文档中具体的对象或概念)、关
Mppdb数据表 选择已创建的Mppdb数据表,具体操作请参考创建数据表。 步骤三:配置基础数据 在异常检测任务列表,单击任务所在行“操作”列的“基础”。 在基础配置页面,默认显示新增任务时配置的信息,单击“字段配置”,切换至“字段配置”页签。 配置对应的参数,配置完成后,单击“确认”。
创建知识库 知识库是一个组织、存储及管理知识的系统,包括文档、数据库、图表、表格等多种形式的信息的分类、整理和归纳,可以帮助用户组织和管理大量的信息,以便快速访问和使用,平台为用户提供了创建并管理知识库的能力,且创建的知识库启用后可在创建Agent时引用。 前提条件 通过OBS接
分摊关闭:所有流控配置的统计粒度,仅针对SLB实例中的单个节点,请根据业务整体流量来合理分配各个单节点的流控门限值,适用于SLB节点变化,后端的请求量也会变化的场景。单个节点流控门限值 = 配置值。 分摊开启:所有流控配置的统计粒度,会针对SLB实例中的节点的数量进行分摊,SLB节
分摊关闭:所有流控配置的统计粒度,仅针对SLB实例中的单个节点,请根据业务整体流量来合理分配各个单节点的流控门限值,适用于SLB节点变化,后端的请求量也会变化的场景。单个节点流控门限值 = 配置值。 分摊开启:所有流控配置的统计粒度,会针对SLB实例中的节点的数量进行分摊,SLB节
交付给用户使用。代码开发是产品开发的重要环节,决定了产品的质量和可靠性。 开发代码的详细指导请参见《开发指南》。 步骤五:提交代码到代码仓 提交代码是AppStage集成代码托管CodeArts Repo服务的能力,在日常代码开发中,开发者更多的时候是将代码托管仓库克隆到本地,在
TRUNCATE_MODE(如果分片的token长度超过向量化模型的token数,则知识库向量化失败)。 SMART_MODE(如果分片的token长度超过向量化模型的token数,则自动对超长部分进行截断处理)。 DEFAULT_MODE(如果分片的token长度超过向量化模型的token数,则大
基本概念 说明 产品 产品是服务的合集,开发中心基于服务进行版本管理。 服务 服务是实现一系列功能的软件模块单元,是产品的组成要素,一个产品一般由一个或多个服务组成。将一个大型的应用程序可以拆分成一组小型、独立的服务。每个服务都运行在自己的进程中,并通过轻量级的通信机制(如HTTP或消息