检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
输入的关键信息将进行加密保存,仅用于模型服务的调用。如果APP code发生变化,更新此处信息后,设置将于2分钟后生效。 API接口协议 标准OpenAI协议 盘古大模型协议 流控配置 超出流控值,则触发限流,用户的请求会因为流控而失败。 无限制 10次/秒 50次/秒 100次/秒 200次/秒 单击“保存”,在模型调测区域调测模型。
是否聚合,0不聚合 1 聚合,默认不聚合 limit 否 limit大小 接口级流控,ip流控,服务级流控,单参数流控必填,其他类型流控无效 burst 否 突发量 接口级流控,ip流控,服务级流控,单参数流控必填,其他类型流控无效 limitTag 否 自定义标签 <=200 表12 configGroups字段说明
ALARM_SINGLE_PARAM_THRESHOLD。 IP流控告警阈值 如果“IP流控”次数达到阈值将产生告警。对应配置文件中的 config.ALARM_IP_THRESHOLD。 接口流控告警阈值 如果“接口级流控”次数达到阈值将产生告警。对应配置文件中的 config.ALARM_URL_THRESHOLD。
String 按照用户配置的工作流请求头参数配置,如果用户配置的工作流输入存在请求头输入,则应该配置对应的参数并在调用时输入特定的值。 表4 请求Body参数 参数 是否必选 参数类型 描述 body 否 Object 调用流请求体,与工作流起始节点配置相关,按照工作流的配置格式填写即可。 响应参数
选择定时调度集群。 执行集群 选择执行汇聚的执行集群。 MPPDB执行集群 (长期存储视图包含该参数)选择执行分钟级、小时级、天级MPPDB汇聚的执行集群。 查询范围 设定任务查询时间范围,不填则默认每分钟执行一次。 例如设置为1小时,则查询时间区间为当前时间减1小时到当前时间(前闭后开)。 Auto
单击实例列表中的实例名称,进入实例基础信息展示页面。 在实例信息区域,单击实例规格后面的“规格变更”。 在“选择电子流”窗口中,选择以下任一方式: 运维操作记录选择“关联电子流”,并选择要关联的电子流,单击“提交”。 运维操作记录选择“紧急问题处理”,并填写紧急原因,单击“提交”。 选择目标实例规格,单击“确定”。
运维中心监控服务 如何查看EAP详细日志? 删除告警任务失败 告警后触发知识编排任务提示alert_type不存在 创建CES指标采集报错
SLB从1.4.5版本开始,自动部署前置检查步骤增加了对系统参数配置的校验,以保证SLB部分功能的正常使用。 表1 参数说明 参数 防呆触发条件 触发动作 fs.file-max <100000 不允许启动 fs.nr_open <fs.file-max 不允许启动 net.ipv4
选择定时调度集群。 执行集群 选择执行汇聚的执行集群。 MPPDB执行集群 (长期存储视图包含该参数)选择执行分钟级、小时级、天级MPPDB汇聚的执行集群。 查询范围 设定任务查询时间范围,不填则默认每分钟执行一次。 例如设置为1小时,则查询时间区间为当前时间减1小时到当前时间(前闭后开)。 Auto
实例个数以使推理单元资源满足需求。 说明: 在推理单元到期后,部署的模型将被下架,可通过购买推理单元资源恢复。 流控配置 超出流控值,则触发限流,用户的请求会因为流控而失败。 无限制 10次/秒 50次/秒 100次/秒 200次/秒 单击“保存”,部署模型服务。 部署完成后,模
第一责任人、第二责任人、扩展人员:设置值班时间段告警的值班责任人。 处理方式:包括立即通知、语音通知、转监控中心和不通知四种方式。 立即通知:告警上报后会立刻触发通知流程。 语音通知:会有三分钟左右的延迟,取决于告警上报的时间。 转监控中心:给AppStage运维中心的监控中心人员打电话。 不通知:告警上报后不通知。
配置的固定阈值下限。 - annomaly_in_mins 告警进入时间 0-30 默认10分钟 告警进入时间,单位分钟。 - annomaly_out_mins 告警退出时间 0-30 默认10分钟 告警退出时间,单位分钟。 - count_threshold 请求量保护参数 0-100000000
表5 管理检索流 操作 说明 启用检索流 在检索流列表中,对于“已停用”状态的检索流,在操作列单击“启用”,启用后的检索流才可在创建Agent时引用。 停用检索流 在检索流列表中,对于“已启用”状态的检索流,可在操作列单击“停用”。 查看检索流详情 在检索流列表中单击检索流名称,查看
按照用户配置的知识检索流请求头参数配置,如果用户配置的知识检索流输入存在请求头输入,则应该配置对应的参数并在调用时输入特定的值。 表4 请求Body参数 参数 是否必选 参数类型 描述 body 否 Object 调用知识检索流请求体,与知识检索流起始节点配置相关,按照知识检索流的配置格式填写即可。
自动化任务使用。根据用户需要的场景,如开发测试环境应用部署、生产环境应用部署等,对这些自动化任务进行自定义编排,一次配置后就可以一键自动化触发调度执行,避免频繁低效的手工操作。 流水线管理常见问题请参见流水线(CodeArts Pipeline)常见问题。 父主题: 开发中心
如何申请组织管理员权限? 组织管理员属于AppStage的系统级权限,购买AppStage的华为云主账号默认为组织管理员,如果其他非购买AppStage的人员需要申请组织管理员权限,申请方法相比常规的权限申请较特殊,请参见本节方法进行申请。 操作步骤 登录AppStage业务控制台。
变更风险项是某个资源的具体变更的风险认定。其描述了认定为风险变更的属性变化,以及能够审批允许的审批人列表。 变更电子流 变更电子流是用于无人值守变更的高度自动化的变更方式,是在部署服务基础上,尽可能将所有的运维手工选择操作前移到提交电子流之前。 Terraform Terraform是HashiCorp公司开发的基础
在“任务列表”页面,可以查看纳管主机触发的“OsDiscovery”任务执行状态。在“ 弹性云服务器”页面,可以查看已纳管的主机。如果在“弹性云服务器”页面查询到所有已纳管主机并且“OsDiscovery”任务都成功,表示纳管成功。 主机分配后会自动触发OS扫描任务,为主机绑定账号,如
隐藏目标:选择相应卡片,与主体卡片隐藏交互效果。 弹出:可设置屏幕内卡片的弹出方式。 触发方式:可选值为“点击”。 点击:任意单击卡片即可触发弹出效果。 弹出方式:可选值为“弹窗”“侧边抽屉”。 局部事件:当“触发方式”为“点击”时,才有此参数。当打开局部事件时,仅对选中卡片的选中区域实现
工作流基础节点说明 LLM 知识库 变量V2 控制 Code代码 结束 父主题: 管理工作流