检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
选择左侧导航栏的“工作负载列表”。 单击工作负载所在行“操作”列的“更多 > 进入命令行”,进入容器执行命令。 应安全管控要求,用户输入的命令都会记录到审计日志中,请避免输入敏感数据。 为集群主机添加标签 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 弹性资源服务(ERS)”。
当前模型网关支持文本对话(Chat)、文本向量化(Embeddings)、文本排序(Rerank)三种类型的API接入。模型API接入之前,请确保符合相对应的接口规范,其中Chat接口和Embeddings接口需要符合OpenAI接口规范,Rerank接口需要符合AI引擎标准协议。
ge将在统一身份认证服务为您创建名为appstage_admin_agency的委托,为保证服务正常使用,在使用AppStage服务期间,请不要删除或者修改appstage_admin_agency委托。AI原生应用引擎、运维中心、运营中心服务授权操作请参考配置AI原生应用引擎/运维中心/运营中心服务授权。
段值。 请通过API提供者或模型供应商获取API Key。 输入的关键信息将进行加密保存,仅用于模型服务的调用。如果API Key发生变化,更新此处信息后,设置将于2分钟后生效。 AK/SK 鉴权方式为“AK/SK”时,配置此参数。 AK:访问密钥ID。 SK:密钥。 请通过API提供者或模型供应商获取AK/SK。
工作流中工具节点的实例如何配置? 工具节点实例需要填写工具创建时所配置的鉴权信息。 三方厂商的工具API,请到工具对应官网获取鉴权信息。 自创建工具请填写工具创建时所配置的鉴权信息。 如果调用其他租户或资源相互隔离的部门所上架的工具,请在AI原生应用引擎中,选择左侧导航栏的“资产中心”,选
新增自定义环境变量 如需添加自定义环境变量,请选择环境变量名,然后单击“添加”。虚机暂无可选自定义环境变量。 清洗规则 选择日志清洗规则。 请优先使用算子清洗模式采样,通过配置解析脚本将原始日志清洗为业务需要的日志字段,算子清洗功能及使用样例请参见算子清洗功能介绍。原始日志采样清洗只适用于单纯采样,不需要清洗的场景。
没有SQL脚本 问题现象 任务创建成功,但是没有sql脚本执行。 处理方法 请自行确认组合包中是否存在除了版本名一样其他字段都一模一样的SQL包,打包禁止出现这种场景,否则获取将包文件信息失败。 或是运维中心存在重复推包的情况,导致存在重复,系统会随机选择一个包执行,可能是执行一个异常的包,没有脚本就是空包。
选择左侧导航栏的“敏感配置管理”。 单击“敏感配置录入”,配置相关参数。参数说明如表1所示。 敏感配置录入后,管理台不会明文显示敏感配置的明文值,请务必妥善保存明文值。 表1 录入敏感配置参数说明 参数 说明 推送实例 选择在哪个环境下配置敏感配置项。 此处选择的环境应与ACMS的部署环
本文介绍如何将微调后的模型或部分平台资产中心的模型部署为模型服务。 前提条件 已购买推理单元资源,具体购买方法请参见购买AI原生应用引擎包年包月资源。 由于在线运行需消耗资源,请确保账户有可用资源,且用户费用状态正常。 需要具备AI原生应用引擎管理员或开发者权限,权限申请操作请参见AppStage组织成员申请权限。 部署模型服务
行情况,确保集群的稳定性以及资源的合理利用。 查看K8S事件 K8S事件在CCE集群上只保留1个小时,如果业务确实需要查看历史的事件信息,请联系ERS在宿主机查看。 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“微服务开发 > 微服务平台”。 选择左侧导航栏的“微服务管理”。
开通自动续费后,还可以手动续费该套餐包。手动续费后,自动续费仍然有效,在新的到期时间前的第7天开始扣款。 自动续费的到期前7日自动扣款属于系统默认配置,您也可以根据需要修改此扣款日,如到期前6日、到期前5日等等。 更多关于自动续费的规则介绍请参见自动续费规则说明。 前提条件 请确认包年/包月套餐还未到期。 在购买AppStage服务页面开通自动续费
我的模型服务”页面“我收藏的”页签下,查看收藏结果,可以便捷地对收藏的模型进行部署、微调、体验。 并非所有模型都支持部署、微调和体验,实际可执行的操作请以界面为准。 父主题: 管理模型
选择左侧导航栏的“敏感配置管理”。 单击“敏感配置录入”,配置相关参数。参数说明如表1所示。 敏感配置录入后,管理台不会明文显示敏感配置的明文值,请务必妥善保存明文值。 表1 录入敏感配置参数说明 参数 说明 推送实例 选择在哪个环境下配置敏感配置项。 说明: 此处选择的环境应与ACMS
当前仅部分区域的主机支持接入AppStage运维中心,包括华北-北京四、华南-广州、华东-上海一、华东-上海二和华北-乌兰察布一 ,如需接入其他区域的主机,请联系技术支持工程师。 当前仅支持x86类型主机安装OpsAgent并接入运维中心,不支持arm类型主机。 步骤一:刷新未纳管主机 进入AppStage运维中心。
欠费说明 用户在使用AppStage服务时,账户的可用额度小于待结算的账单,即被判定为账户欠费。欠费后,可能会影响服务资源的正常运行,请及时充值。 欠费原因 已购买资源包,但使用量超出资源包额度,进而产生按需费用,同时账户中的余额不足以抵扣产生的按需费用。请参考已购买资源包,为什
选择需要关联的迭代,也可勾选“自动创建新迭代”,自动创建的新迭代名称默认为版本号。 产能 必填项,指版本开发团队每天能提供的开发人员的数量。单位:人/天。 选择计划时间 版本开始时间 必填项,版本开始的日期。 自动创建新发布计划或自动创建新迭代时,开始时间默认为设置的版本开始时间。
#租户名称 "domainName": "https://example.tenantaccount.com", #域名 "flag": 1, #0:删除,1:新增,2:修改
#必填,匹配条件;取值有equal,pattern values: example.com #必填,域名值 limit: 1000 #必填,流控值 burst:
数据集是模型微调的基础,首先需要创建用于模型训练的数据集。 创建模型微调流水线 通过模型微调任务进行模型训练,微调任务结束后,将生成改进后的新模型。 部署模型 模型部署是通过为基座模型(即原模型)和微调后的新模型创建用于预测的模型服务的过程实现。 测试模型调优效果 在线测试微调后的模型(输入问题发起请求获取数据分
选择需要关联的迭代,也可勾选“自动创建新迭代”,自动创建的新迭代名称默认为版本号。 产能 必填项,指版本开发团队每天能提供的开发人员的数量。单位:人/天。 选择计划时间 版本开始时间 必填项,版本开始的日期。 自动创建新发布计划或自动创建新迭代时,开始时间默认为设置的版本开始时间。