检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
知识库”,选择页面右上角的“... > 知识数据集”,在数据集列表中,单击数据集名称,进入详情页即可获取数据集id。 约束限制: 不涉及。 取值范围: 只能由英文字母、数字以及“-”组成,且长度为36个字符。 默认取值: 不涉及。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 Authorization
系统后台审批通过之后,会通过邮件(如果在申请表中填写了邮箱地址)或短消息的方式通知您。 在“我的公测”页面单击“前往控制台”,或在AppStage官网页,单击“控制台”,进入服务控制台购买AppStage。
选择退订原因,阅读并确认退订提示,单击“退订”。 图2 退订实例 退订按需计费资源以停止计费 登录AppStage控制台,进入AppStage控制台。 在AppStage控制台左侧导航栏选择“AI原生应用引擎”,在AI原生应用引擎详情页面的“我的资源”区域的资源列表中,单击需要停止计费的资源“操作”列的“退订”。
在“工具链集成”页面,单击右上角“添加工具”。 在“基础信息”页面,配置如表1所示参数。 表1 添加工具参数说明 参数名称 参数说明 工具LOGO 单击系统默认图片上的“点击修改”,可选择系统预置图片作为工具LOGO,也可单击“上传LOGO”,上传本地图片作为工具LOGO,上传图片支持支持JPG、JPEG、PNG和BMP,最大10MB。
环境准备 操作步骤 在华为云控制台,完成如表1所示的资源购买。 表1 资源列表 资源名称 说明 参考文档 CCE集群 购买1个CCE集群。 根据业务需要选择规模,本实践中选择集群规模为50节点。 购买集群 ECS服务器 购买1个ECS服务器,容灾场景下购买2个ECS服务器。 根据
继续使用。 订单支付成功后自动开通服务,生效时间以订单时间为准。 购买AppStage 打开AppStage官网页,单击“控制台”,并登录。 在应用平台控制台首页,单击“立即购买”。 根据需求购买。 购买AI原生应用引擎 选择“AI原生应用管理”页签。 在“订购方式”区域下,选择“自由订购”或“定制套餐”。
在“未纳管主机”页面,单击“主机刷新”。 选择待刷新未纳管主机的主机类型、所属的公有云账号和所在Region后,单击“确定”。 如果选择不到已有资源的Region,需要将鼠标悬停在右上角的账号,在下拉列表选择“服务环境配置”,在“账号列表”页面单击对应账号后的“编辑”,然后单击“确定”,自动刷新该账号下的region信息。
在AI原生应用引擎的左侧导航栏选择“模型中心 > 模型调测”。 对于平台预置的模型以及模型服务商提供的模型,也可以在左侧导航栏单击“资产中心”,将鼠标移至大模型卡片并单击“体验”,进入模型调测页面。 在“模型调测”页面,可调测文本对话类型模型、文本生图类型模型、图像理解类型模型、语音转文
在问题。 前提条件 需要具备AppStage指标开发者或运营管理员权限,权限申请的操作请参见权限管理。 操作步骤 登录AppStage业务控制台。 在快捷入口选择“运营中心”,进入运营中心。 在左侧导航栏选择“看板”,如图1所示。 图1 看板
请谨慎选择关联的组织。 前提条件 登录用户为已实名认证的华为账号或华为云账号。 已购买AppStage。 关联组织 登录AppStage控制台。 在左侧导航,选择“总览”,在页面顶部根据提示单击“去关联”;或在“应用平台使用向导”区域的“关联组织”节点单击“去关联”以关联使用AppStage的组织。
操作人、操作时间等。 前提条件 需要具备AppStage运营管理员权限,权限申请的操作请参见权限管理。 操作步骤 登录AppStage业务控制台。 在快捷入口选择“运营中心”,进入运营中心。 在左侧导航栏选择“审计日志”,进入审计日志页面,如图1所示。 图1 审计日志
Runtime)可以对微服务本身及其相关的资源进行管理。 通过微服务平台管理微服务 配置负载均衡 负载均衡(SLB)提供反向代理、负载均衡、路由分发、灰度分流、限流降级、访问控制、监控告警等能力。 配置运维中心负载均衡 管理Cloud Map中的服务资源 服务发现(Cloud Map)是云服务统一的服务注册发现中心,主要解决业务依赖环境配置繁琐的难题。
图3 VMS功能架构图 弹性资源服务 弹性资源服务(Elastic Resource Service,简称ERS)提供资源池监控、访问安全控制、任务调度、业务负载弹性伸缩、集群联邦、配额管理和多种K8s扩展等能力,通过统一的对外接口提供业务管理能力,上层业务不再感知下层资源。同时
、模型调优、知识工程等能力,帮助客户选好、管好、用好大模型,从而提升大模型应用效果。 构建企业应用与大模型之间的安全隔离带,结合华为云安全控制机制,保障AI原生应用安全可信。 高可用 高可用能力内置,使得应用可用度原生99.99%。 基于NUWA微服务开发框架,预集成构建云服务业
发布OLC服务 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“微服务开发 > 负载均衡”。 选择左侧导航栏的“过载控制管理 > OLC服务”。 单击待发布OLC服务操作列的“发布”。 您也可以单击待发布服务的名称,在流控服务详情页面,单击右上角的“发布”。
发布OLC服务 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“微服务开发 > 负载均衡”。 选择左侧导航栏的“过载控制管理 > OLC服务”。 单击待发布OLC服务操作列的“发布”。 您也可以单击待发布服务的名称,在流控服务详情页面,单击右上角的“发布”。
的一种机制。 Pod Pod是Kubernetes创建或部署的最小单位。一个Pod封装一个或多个容器、存储资源、一个独立的网络IP以及管理控制容器运行方式的策略选项。 Node Node是一个执行具体工作的机器,可以是虚拟机或者物理机。Pod是部署在Node节点上的,如果Node
U和1050Mi的内存,具体请参见表1,可以通过修改deployment的YAML文件中各插件(container)的requests大小控制集群的资源占用量,具体操作请参见如何调整纳管集群的资源占用量。 图1 纳管状态 父主题: 单点接入资源
C16G等。 flavor: 2C4G armFlavor string 可选 "2C4Gi" 参考flavor 双AZ arm混部时独立控制arm配置 arm配置建议: 按照业内通用的指导,arm cpu算力相对于x86下降,具体下降指标和使用场景密切相关。 对于计算密集型的业
权限申请的操作请参见权限管理。 复制屏幕模板 预置模板在使用时,需要复制到“我的模板”中,方可用于后续创建屏幕。 登录AppStage业务控制台。 在快捷入口选择“运营中心”,进入运营中心。 在左侧导航栏选择“看板管理 > 公共屏幕模板”。 选择“预置模板”页签,在对应的屏幕模板上,单击“更多