检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
推理单元包周期 将基础或者预训练后的模型部署为在线服务时使用的算力单元,通过购买推理单元实现服务QPS扩容。 实例数 可购买的实例数量为1~50个。 AI原生应用引擎基础版 支持知识库容量,智能应用运行时引擎,开通ChatGLM3-6B服务、大模型调优服务API在线调用。 套餐包单价+按
不一致? 如何处理资源间绑定服务不一致? 同一个SQL包重复显示时怎么处理? 更多 AI原生应用引擎 我创建的微调数据集会被其他用户调用去训练他们的大模型吗? 模型微调任务一直在等待中是什么原因? AI原生应用引擎支持所有数据集进行数据标注吗? 更多 开发中心 如何申请组织管理员权限?
AI原生应用引擎 我创建的微调数据集会被其他用户调用去训练他们的大模型吗? 模型微调任务一直在等待中是什么原因? 大模型微调需要的数据有要求吗? AI原生应用引擎支持所有数据集进行数据标注吗? AI原生应用引擎中预置了哪些提示语? AI原生应用引擎训练好后的模型如何获取? 模型调测时,无法选择模型服务商API是什么原因?
选择使用虚拟机还是容器执行作业。 运维账号 作业类型选择虚拟机时,还需要选择运维账号或者手动输入账号,用于连接目标机器(选择的资源)。 资源 选择需要使用的资源机器,在机器上执行作业脚本。 选择脚本 选择执行脚本。 脚本参数 输入脚本参数。 分批执行 作业类型选择虚拟机时,可以选择是
是否启用灰度 当选择“是”时,分流规则在SLB生效,满足分流规则条件的消息分发到灰度机器群组,不满足分流规则条件的消息分发到生产机器群组。 当选择“否”时,分流规则在SLB不生效。消息会在生产机器+灰度机器的整个群组中负载均衡分发。 全网发布时的路由策略 当选择“默认路由”时,全网发布时在生产+灰度的大集群中负载均衡。
是否启用灰度 当选择“是”时,分流规则在SLB生效,满足分流规则条件的消息分发到灰度机器群组,不满足分流规则条件的消息分发到生产机器群组。 当选择“否”时,分流规则在SLB不生效。消息会在生产机器+灰度机器的整个群组中负载均衡分发。 全网发布时的路由策略 当选择“默认路由”时,全网发布时在生产+灰度的大集群中负载均衡。
I,但是该模型能力有限,只能作为问答模型,不能作为思考模型。首次使用该模型服务API需要订购免费的“ChatGLM3-6B大模型服务API在线调用”资源,订购后即可进行体验,订购操作请参见购买AppStage。 平台预置了开源模型Qwen系列、DeepSeek系列等,请参考将已有
memory) nginx: [alert] munmap(FFFFFFFFFFFFFFFF, 524288000) failed" 解决方法 使用的机器最低规格为2C8G。 登录SLB实例主机,执行命令/opt/huawei/openresty/init.d/nginx restart,重启Nginx再同步。
选择左侧导航栏的“服务目录 > 一方服务”。 在一方服务页面,选择“微服务实例列表”页签。 单击微服务实例列表操作列的“上线”,将实例调整为上线状态。 下线实例 将在线的微服务调整为下线状态。下线实例将会让微服务实例不再接收流量,请确认后操作。 在微服务实例列表中,单击微服务实例列表操作列的“下线”。 在
本文介绍如何将微调后的模型或部分平台预置的模型部署为模型服务。 前提条件 已购买推理单元资源,具体购买方法请参见购买AI原生应用引擎包年包月资源。 由于在线运行需消耗资源,请确保账户有可用资源,且用户费用状态正常。 需要具备AI原生应用引擎管理员或开发者权限,权限申请操作请参见AppStage组织成员申请权限。
代码仓管理是开发中心集成代码托管(CodeArts Repo)服务的能力,是遵循Git的基本运行模式的分布式版本管理平台,其具备安全管控、成员/权限管理、分支保护/合并、在线编辑、统计服务等功能,旨在解决软件开发者在跨地域协同、多分支并发、代码版本管理、安全性等方面的问题。 本章节介绍如何使用开发中心集成的CodeArts
代码仓管理是开发中心集成代码托管CodeArts Repo服务的能力,是遵循Git的基本运行模式的分布式版本管理平台,其具备安全管控、成员/权限管理、分支保护/合并、在线编辑、统计服务等功能,旨在解决软件开发者在跨地域协同、多分支并发、代码版本管理、安全性等方面的问题。 关于代码仓管理的常见问题请参见代码托管(CodeArts
选择左侧导航栏的“服务目录 > 一方服务”。 在一方服务页面,选择“微服务实例列表”页签。 单击微服务实例列表操作列的“上线”,将实例调整为上线状态。 下线实例 将在线的微服务调整为下线状态。下线实例将会让微服务实例不再接收流量,请确认后操作。 在微服务实例列表中,单击微服务实例列表操作列的“下线”。 在
AppStage开发中心知识库是面向开发团队的知识管理系统,支持知识全生命周期管理,帮助您完成智能、安全的知识作业,提供层级式的目录树、多人在线协同编辑等功能。 目前此功能仅支持白名单用户通过提交工单申请使用。详细操作请参考提交工单。 前提条件 已获取项目经理、开发人员或测试人员角色权限,权限申请方法请参见申请权限。
/opt/huawei/openresty/slb_agent/conf/slb_agent.conf查看是否为空,若为空,获取正常状态的SLB机器的文件粘贴至该文件。 然后执行/opt/huawei/openresty/init.d/slb_agent restart重启即可。 父主题:
appstage.myhuaweicloud.com”。 基本概念 大模型推理服务 直接调用预置大模型提供API完成推理过程。 私有模型部署 针对已经微调训练好的模型,如需评测此模型效果,或通过应用调用此模型,则需将模型部署为线上服务。 向量知识库 通过引入多种类型和格式的企业知识,将数据转化为
操作 :删除节点。 对后端集群配置健康检查,检查后端服务集群中的机器。参数说明如表4所示,配置完成后单击“下一步”。 表4 健康检查参数说明 参数 说明 集群名称 展示后端服务器集群名称,检查的是后端服务集群里的机器。 域名 输入健康检查的请求域名。 检查路径 检查路径存在,采取的是http/https形式。
操作 :删除节点。 对后端集群配置健康检查,检查后端服务集群中的机器。参数说明如表4所示,配置完成后单击“下一步”。 表4 健康检查参数说明 参数 说明 集群名称 展示后端服务器集群名称,检查的是后端服务集群里的机器。 域名 输入健康检查的请求域名。 检查路径 检查路径存在,采取的是http/https形式。
关参数,参数说明如表1所示。单击“保存”。 表1 健康检查参数说明 参数 说明 集群名称 展示后端服务器集群名称,检查的是后端服务集群里的机器。 域名 输入健康检查的请求域名。 检查路径 检查路径存在,采取的是http/https形式。 打开“是否开启健康检查”开关,开启后弹出提
发现 服务之间 服务提供方通过IaC注册地址。 通过Cloud Map SDK查询。 服务内部微服务之间 通过Cloud Map SDK注册机器IP,并维持心跳。 通过Cloud Map SDK发现。 数据库 通过IaC申请数据库,数据库管理台自动注册。 通过中间件SDK访问。 接口类型服务