正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
微调的模型部署参数说明 参数名称 参数说明 实例个数 设置模型服务部署的实例个数。 不同的模型部署1个实例需要的推理单元个数不同,比如,ChatGLM3-6B需要2个实例。 不同的模型因为模型参数量不同,模型参数量越多,需要消耗的资源越多,因此需要的推理单元个数越多。 推理单元资源
查看服务返回结果 单击“查看服务返回结果”,进入“数据响应结果”页面,进行数据影射,配置完成后自动保存。 在右侧设置组件属性。不同组件显示的组件属性不同,具体以界面显示为准。这里以“图表组件 > 折线图”为例,请参考表7。 表7 图表卡片组件属性参数说明 参数 说明 基础属性 绑
管理指标仓库 在运维中心指标仓库创建指标 为指标创建不同类型的视图 为指标关联标签 新增维度标签 订阅BaaS服务已共享指标 父主题: 使用监控服务进行资源及业务监控
微服务英文名是微服务在系统内的唯一标识,录入后不可修改,系统在部分场景下会使用微服务英文名代替微服务中文名进行展示。 单击“创建”,在微服务列表中可查看到此新建的微服务“状态”为“草稿”,创建微服务信息完成。 更多操作 创建微服务信息完成后,您还可以执行如下表1的操作。 表1 更多操作 操作
API在线调用、ChatGLM3-6B大模型服务API在线调用、大模型微调服务API在线调用-SFT局部调优将无法再使用。 华为云根据客户等级定义了不同客户的宽限期和保留期时长。 关于充值的详细操作请参见帐户充值。 父主题: 计费模式
组合型:指标体系中由多个指标组合而成的指标。 同比增长率:指某个指标在当前时期与同期相比的增长率,通常用于比较不同时间段的数据变化情况。 环比增长率:指某个指标在两个连续时间段内的增长率,通常用于比较同一指标在不同时间段内的变化情况。 组合方式 指多个普通型指标组合成复合型指标的方式。仅当“复合类型”为“组合型”时,该参数为必填参数。
自动续费 开通自动续费后,应用平台服务会在每次到期前自动续费,避免因忘记手动续费而导致资源被自动删除。 在一台包年/包月应用平台生命周期的不同阶段,您可以根据需要选择一种方式进行续费,具体如图1所示。 图1 应用平台生命周期 应用平台从购买到到期前,处于正常运行阶段,资源状态为“运行中”。
监控服务(ServiceInsight)”。 选择左侧导航栏的“监控 > 业务报表”,进入所在服务监控大盘页面。 在监控大盘中查看具体的监控数据,也可在左侧切换页面查看不同的报表数据。 父主题: 使用业务报表进行业务监控
版本发布时间 必填项,版本发布的日期。 自动创建新发布计划或自动创建新迭代时,发布时间默认为设置的版本发布时间。 单击“提交”。 在版本列表中可查看到此新建版本。 规划交付件 在开发中心左侧导航栏,选择“版本管理”。 在版本管理页面的版本列表中,单击版本号,在版本详情页面的“版本持续交付”区域,选择“持续规划
操作步骤 在AI原生应用引擎左侧导航栏选择“配置中心 > 模型鉴权设置”。 在“模型供应商列表”页面,单击模型供应商卡片上“设置鉴权”,针对不同的模型服务设置相应鉴权信息。 父主题: 配置中心
说明 按班次 班次配置指的是一天内(00:00 - 24:00)的配置。如果一天只有一个配置,则不需要对时间进行分片;如果一天内根据不同的时间段有不同的限制,则可以对一天(00:00 - 24:00)进行分片处理,分为几个时间段再进行配置。 按周 按周的模板是按天的进阶版,在按天的
sql这个文本文件内容所构成的字符串 带global的多文件描述结构 Spec包通过不同规格目录来描述同一个服务在不同用途环境下所需的基础设施。但是,同一服务的不同的规格仍然存在大量相同的配置,需要一种机制来完成不同规格间配置的复用。因此,IaC支持放置一个global目录,其与specs
检索知识库数据 功能介绍 检索知识库数据,根据用户提供的检索信息,返回命中的信息数据。 URI POST /v1/knowledge-bases/{knowledge_base_id}/embed-datas 表1 路径参数 参数 是否必选 参数类型 描述 knowledge_base_id
后续操作:将已纳管的弹性云服务器主机设置为执行机 同一VPC下需要设置一个执行机,用于部署服务虚拟机部署、监控服务日志接入/脚本执行、负载均衡创建实例、数据库治理纳管实例和数据查询时使用。 选择左侧导航栏的“云服务器管理 > 弹性云服务器”。 单击待设置为执行机的主机所在行“操作”列的“更多 >
在使用AppStage前可按照此使用引导完成初始化配置: 部门与成员管理(添加部门、添加成员) 应用基础信息管理(创建产品、创建服务) 角色权限配置(为组织成员配置各中心不同岗位的角色权限) 3 基础信息 对企业拥有的产品、服务、微服务的相关信息进行规范管理和维护。主要包括: 产品管理:创建、查看、编辑、删除、
加权轮询算法:根据后端服务器的权重,按顺序依次将请求分发给不同的服务器,权重大的后端服务器被分配的概率高。 加权最少连接:加权最少连接是在最少连接数的基础上,根据服务器的不同处理能力,给每个服务器分配不同的权重,使其能够接受相应权值数的服务请求。 源IP算法:对不同源IP的访问进行负载分发,同时使得同
单击实例列表操作列的“日志”,查看切换进度。 主机申请阶段,包括申请主机、SLB部署及配置同步。 主机申请成功后,单击实例列表中的实例名称,在实例详情中可以看到平台托管的主机,如图4所示。 图3 切换进度 图4 查看申请的主机 流量切换阶段。 查看每一节点上下线主机列表。 平台按1%-10%-20
2*100%=20%,如果配置的X是1~20,则会触发告警。 告警等级 告警分为提示、一般、严重三个等级。 如果相同的告警指标,指标配置不同,告警等级不同,如果都触发告警,则最终会按照配置了最高等级的指标配置进行告警提示。 单击“提交”。 告警配置完成后,在告警配置列表中开启“是否开启”列的开关,才能生效。
计费FAQ 如何选择不同的产品? 应用平台AppStage开发中心、运维中心、运营中心可以分开订购,企业根据自己的使用场景按需开通各个中心。运行时引擎不能单独开通,运行时引擎必须依赖于运维中心,即开通运行时引擎必须开通运维中心。 运行时引擎开通有何特殊要求? 运行时引擎必须依赖于
监控服务(ServiceInsight)”。 选择左侧导航栏的“监控 > 业务报表”,进入所在服务监控大盘页面。 在监控大盘中查看具体的监控数据,也可在左侧切换页面查看不同的报表数据。 父主题: 数据应用