检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
说明: 多AZ要配置AZ的倍数,如果部署了双AZ,那么此处要配置为2的倍数。 如果使用了evs盘或者elb,为保证滚动升级每个AZ至少保留一个节点,那么单AZ至少要配置为2,双AZ至少配置为4。 1 pdbMaxUnavailable string 非必选 - Pod干扰预算 整数百分比,整数范围为[1
在编排页面编排流程,如图1所示,编排完成后单击上方保存。 单击左侧中间蓝色箭头,展开流程列表。 选择需要的动作拖入右侧区域,并按执行顺序编排。 单击流程节点进入设置页面,设置节点参数。 图1 流程编排 执行流程 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 监控服务(ServiceInsight)”。
了许多扩展功能,如数据压缩、数据分区、分布式查询等。它被广泛应用于互联网企业、金融、电商、游戏等领域。 节点数 节点数是指在一个特定的环境中,例如测试或生产环境,需要部署的节点数量。 镜像名称 用于标识环境配置的镜像。 镜像版本 用于区分一个镜像库中不同的镜像文件所使用的标签。 资源规格
如何对平台接入的第三方模型服务设置鉴权 平台资产中心接入了第三方供应商的闭源模型,例如GLM系列、Moonshot系列等,这些模型服务在调测(体验)、调用前,需要先设置模型鉴权。 前提条件 需要具备AI原生应用引擎管理员权限,权限申请操作请参见AppStage组织成员申请权限。 操作步骤
模型服务进行模型调测,并支持在创建Agent时使用或通过模型调用接口调用。 本文介绍如何将微调后的模型或部分平台资产中心的模型部署为模型服务。 前提条件 已购买推理单元资源,具体购买方法请参见购买AI原生应用引擎包年包月资源。 由于在线运行需消耗资源,请确保账户有可用资源,且用户费用状态正常。
A等。 创建守护进程集:即Kubernetes中的“DaemonSet”,守护进程集确保全部(或者某些)节点都运行一个Pod实例,支持实例动态添加到新节点,适用于实例在每个节点上都需要运行的场景,如ceph、fluentd、Prometheus Node Exporter等。 普
需要部署的资源串联起来,从而环境变更的过程。如果把pipeline比作一棵树的声明,那么所有tasks都是这棵树的子节点,Apply是这棵树的叶子节点,只有叶子节点被执行时才会对环境产生影响。 图2 pipeline任务声明 Serial(串行)/Parallel(并行)任务定义
一站式创建Agent时如何取消选择默认模型,更换为其他模型 单击已选择的模型名称,在弹出框中单击模型名称后面的,取消选择当前模型,在下拉框中重新勾选其他模型即可。 父主题: AI原生应用引擎
配置服务环境 录入其他公有云账号 为资源接入准备环境 录入企业项目 为服务规划业务账号(可选) 父主题: 单点接入资源
登录用户为已实名认证的华为账号或华为云账号。 已购买AppStage并关联组织。 配置AI原生应用引擎/运维中心/运营中心服务授权 登录AppStage控制台。 在弹出的“服务授权”对话框,勾选需要授权的授权项,单击“同意授权”。 购买AI原生应用引擎、运维中心或运营中心之后,系统
修改。如果部分已纳管主机的账号不想被修改,可以创建密码白名单规则,具体操作请参见创建密码白名单规则。 前提条件 已购买主机,具体操作请参见购买弹性云服务器ECS或购买裸金属服务器BMS。 已获取基础运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 待纳管主机的服务已规划业务账号。
选择账号归属的云厂商。 华为公有云账号ID 使用华为云并购买资源时注册的账号的账号ID。 获取方式:在华为云控制台,鼠标悬停在右上角的用户名,选择下拉列表中的“我的凭证”,在“API凭证”页面查看。 华为公有云账号名称 使用华为云并购买资源时注册的账号的账号名。 获取方式:在华为云控制
登录用户为已实名认证的华为账号或华为云账号。 已购买AppStage并关联组织。 配置AI原生应用引擎/运维中心/运营中心服务授权 登录AppStage控制台。 在弹出的“服务授权”对话框,勾选需要授权的授权项,单击“同意授权”。 购买AI原生应用引擎、运维中心或运营中心之后,系统
纳管主机 纳管Linux主机 纳管Windows主机 父主题: 单点接入资源
PostgreSQL GeminiDB(for Cassandra) RDS for mySQL 数据库实例 选择待纳管的数据库实例。 种子节点 GeminiDB(for Cassandra)需要配置此参数。 VIP TaurusDB/RDS for mySQL需要配置此参数。 VIP地址为实例的内网读写地址。
集群创建完成后,单击“新增节点”,在节点列表中配置相关参数,参数说明如表3所示。配置完成后单击“下一步”。 勾选多条节点,单击“批量删除”,可以批量删除节点。 单击“全部勾选”,可以快速勾选当前集群下的所有节点。 单击“清除多选”,取消选择选中的多条节点。 表3 新增节点参数说明 参数 说明
工作流的返回是json格式,但是大模型会进行总结,如何以json格式直接输出? 创建Agent配置工作流时,支持选择模式,选择为“总结模式”时,大模型会对工作流的输出进行总结;选择为“精确模式”时大模型不会总结,直接返回工作流的输出,如图1所示,具体介绍请参见创建并发布Agent。
为容器集群安装插件 ERS提供通过插件模板为集群安装插件的功能,本章节介绍如何为集群安装插件。 前提条件 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 为集群安装插件 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 弹性资源服务(ERS)”。
单击,选择“微服务开发 > 数据库治理”。 选择左侧导航栏的“实时诊断”。 在左侧树中选择目标数据库类型以及目标节点,选择“WDR”页签。 选择“实例级”或“节点级”页签,您可以从实例级、节点级两种方式生成WDR报表。 选择“开始snapshot”及“结束snapshot”,单击“生成WRD报表”,即可生成性能报告。
单击,选择“微服务开发 > 数据库治理”。 选择左侧导航栏的“实时诊断”。 在左侧树中选择目标数据库类型以及目标节点,选择“WDR”页签。 选择“实例级”或“节点级”页签,您可以从实例级、节点级两种方式生成WDR报表。 选择“开始snapshot”及“结束snapshot”,单击“生成WRD报表”,即可生成性能报告。