检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在微服务平台删除POD实例 本文介绍如何删除POD实例。 前提条件 需要具备AppStage服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 删除实例 执行删除实例操作,Kubernetes会逐个删除该POD实例下的所有容器,并等待每个容器完成退出。如果POD实例因
配置告警通知 告警的通知在所有的告警处理的链路结束以后才会发生。告警处理模块会根据上报告警的上下文获取告警的值班配置,值班配置由业务预置。配置对应的责任人,当告警生成时,通过WeLink、短信或电话形式,快速通知责任人。 新建语音值班配置前需要先新增模板。模板是产品级共享,模板列
在WiseDBA中变更数据库实例规格 可以根据业务需要对包年/包月和按需实例的规格进行变更,规格指实例的CPU/内存。 使用须知 此操作预计耗时约10分钟,程序可能会有10s以内的中断,请自行评估影响。 前提条件 需要具备AppStage服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。
long_text_solution String 参数解释: 知识数据集切片长文本处理方式。 取值范围: 枚举值: TRUNCATE_MODE(截断模式:如果分片的token长度超过向量化模型的token数,则自动对超长部分进行截断处理)。 SMART_MODE(智能模式:如果分片的token长度超
在WiseDBA中变更数据库实例规格 可以根据业务需要对包年/包月和按需实例的规格进行变更,规格指实例的CPU/内存。 使用须知 此操作预计耗时约10分钟,程序可能会有10s以内的中断,请自行评估影响。 前提条件 需要具备AppStage服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。
参数和“温度”只设置1个。 存在惩罚 介于-2.0和2.0之间的数字。正值会尽量避免重复已经使用过的词语,更倾向于生成新词语。 频率惩罚 介于-2.0和2.0之间的数字。正值会尽量避免使用常见的单词和短语,更倾向于生成较少见的单词。 内容安全监测配置 当“输出方式”为“非流式”时,显示此参数。
设置解决时限:单击“编辑”,设置解决时限后单击“确定”,如图1所示。 图1 设置解决时限 设置通知方式:勾选事件通知方式,支持Welink和手机短信。 如需使用Welink通知,需要先配置对接华为云WeLink,配置后显示该选项。 设置排班表:选择需要配置的服务,双击排班表的具体时间表格,显示“编
cn_dev_default规格目录,可用于描述一个开发用途的服务环境所使用的基础设施 └── cn_product_default # cn_product_default规格目录,可用于描述一个生产用途的服务环境所使用的基础设施 └── meta
新增维度标签 监控服务支持对数据进行维度管理,新增维度标签后,在创建逻辑主体时添加字段可以选择公共维度,对字段使用维度过滤。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 新建维度 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维
#AppStage平台没有RMS权限,需要申请RMS FullAccess或者RMS ReadOnlyAccess权限。 处理方法 在“服务环境配置 > 账号列表”中查看创建CES指标采集时使用账号的纳管方式是“AK-SK”还是“授权委托”,并查看对应的“IAM用户名”或者“授权委托名”。 添加权限。
(服务+微服务)的粒度注册微服务的,不会保存offering信息,因此如果只是切换offering,服务名和微服务名保持不变,那么在STS上不用做任何操作,可以直接使用之前注册的微服务。 父主题: 运维中心访问凭据管理服务
细分领域如金融、电网场景,需要对推理结果进行定制调整,则可在AI原生应用引擎使用模型在线微调训练功能,快速生成行业场景定制模型服务,满足用户特定需求。 对话沟通 通过对话沟通,快速理解并响应客户的需求,提供高效的解决方案或信息。对于涉及行业和领域的专业知识或技术,平台的知识库能够有效地补
调用文本对话模型服务 功能介绍 调用大语言模型推理服务,根据用户问题,获取大语言模型的回答。 调用方法 请参见如何调用API。 URI POST https://aiae.appstage.myhuaweicloud.com/v1/chat/completions 请求参数 表1
注册用户数总数 指从网站或应用程序启动以来注册的总用户数量。这个指标可以用来跟踪用户数量的整体趋势,以及比较不同时间段的注册用户数。 使用建议 使用该模板可以跟踪注册用户数量的变化,以便更好地了解用户增长趋势,并做出相应的业务决策。 父主题: 指标模板库介绍
SDK概述 AI原生应用引擎SDK面向开发者提供了一套搭建原生应用的Python SDK,包含了模型调用,知识获取,工具调用等功能。开发者可以使用SDK调用AI原生应用引擎的各种能力,帮助开发者快速构建大模型应用。 表1 模块说明 序号 模块 功能 1 HttpxClient 负责发送HTTP请求的基类。
录入并绑定华为云镜像仓SWR AppStage运维中心将镜像仓SWR进行统一管理,可以绑定使用该镜像仓中的镜像用于服务的容器升级变更。 创建SWR 通过创建SWR将华为云镜像仓SWR录入至运维中心进行统一管理。 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维
选择异常检测任务调度集群,初始化监控服务时会自动分配两个调度集群, scheduleCluster-ops:数据汇聚任务使用。 scheduleCluster-ops-ad:异常检测任务使用。 Mppdb集群 选择Mppdb集群。 Mppdb数据库 选择Mppdb数据库。 Mppdb数据表 选择
memory) nginx: [alert] munmap(FFFFFFFFFFFFFFFF, 524288000) failed" 解决方法 使用的机器最低规格为2C8G。 登录SLB实例主机,执行命令/opt/huawei/openresty/init.d/nginx restart,重启Nginx再同步。
该指标用于统计测量对象的CPU使用率。 0~100% 百分比(Percent) ops_node_cpu_limit_core 该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core) ops_node_cpu_used_core 该指标用于统计测量对象已经使用的CPU核个数。 ≥0
调用文本向量化模型服务 功能介绍 将用户输入的文本转化成数字向量,多用于从向量化知识库中查询相似的文本。 调用方法 请参见如何调用API。 URI POST https://aiae.appstage.myhuaweicloud.com/v1/embeddings 请求参数 表1