检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
凭据,用于认证。为了把认证凭据授权给业务A、B、C,需要将认证凭据明文发送给业务A、B、C的开发人员,从而两边持有相同的认证凭据。本章介绍如何通过管理台查询认证凭据。 查询认证凭据 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“安全 > 访问凭据管理服务”。
模型需要部署成功后才可正式提供模型服务。部署成功后,可以对模型服务进行模型调测,并支持在创建Agent时使用或通过模型调用接口调用。 本文介绍如何将微调后的模型或部分平台资产中心的模型部署为模型服务。 前提条件 已购买推理单元资源,具体购买方法请参见购买AI原生应用引擎包年包月资源。
凭据,用于认证。为了把认证凭据授权给业务A、B、C,需要将认证凭据明文发送给业务A、B、C的开发人员,从而两边持有相同的认证凭据。本章介绍如何通过管理台查询认证凭据。 查询认证凭据 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“安全 > 访问凭据管理服务”。
进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 弹性网络服务(ENS)”。 选择左侧导航栏的“网络资源 > 公有云ELB”,进入“公有云ELB”页面。 单击待创建监听器的ELB名称,进入ELB详情页面,默认显示“基本信息”页签。 单击“监听器”,切换至“监听器”页签。
运维中心弹性资源服务 如何调整纳管集群的资源占用量? ers-monitoring和ers-manger有什么区别?
运维中心部署服务 更新环境的代码包不存在规格cn_product_default 更新环境时报错 如何自动获取验签?
实际创建资源的TF文件 "variablestf": "variable.tf" // 存储参数变量的TF文件 } main.tf RFS实际使用的模板文件,通过此文件来管理华为云资源。当前支持的华为云资源有CCE、DCS、DNS、ECS、Kafka、RDS及VPC,模板文件样例分别参
支持为实时监控页面添加图表,图表类型包括折线图、表格、Block。一个页面可以添加多个图表,添加后,可以在该页面配置图表布局。本章节以折线图为例介绍如何添加图表。 前提条件 已新增实时监控页面。 已获取服务运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 为实时监控页面添加图表 进入实时监控页面。
在“微服务管理”页面,组织管理员可以创建、查看、编辑、删除、发布、同步或下线微服务相关信息,非组织管理员仅可查看微服务详情。本章节介绍如何创建微服务。 前提条件 已创建服务,且服务的“状态”为“已发布”。 创建微服务 登录AppStage首页。 支持租户管理员(华为账号)及通
网络ACL是一个子网级别的可选安全层,通过与子网关联的出方向/入方向规则控制出入子网的网络流量。ENS支持为已创建的虚拟机类型资源的隔离域关联ACL,本章节介绍如何为隔离域关联ACL。 前提条件 已获取服务运维岗位权限、基础运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 已创建隔离域。 已创建网络ACL并添加规则。
模型使用指引 基于微调数据集进行模型微调 生成模型服务 调测/体验模型 评测模型 查看模型调用记录 收藏平台资产中心的模型 模型API接入接口规范 如何对平台接入的第三方模型服务设置鉴权
LoRA(Low-Rank Adaptation)是一种轻量级大模型微调技术,通过低秩矩阵分解技术显著减少了微调所需的参数,降低了微调过程中所需的存储和计算资源,可灵活地运用于不同的预训练模型和任务。 Loss曲线 Loss曲线是一个用于评估模型训练效果的工具,它展示了模型在训练过程中产
本文通过调用一系列知识中心的API介绍知识库的更新流程,适用于当数据源为OBS接入时,在OBS上进行文件增删改后,将改动同步到知识库的场景。API调用方法请参见如何调用API。 前提条件 用户接入的OBS目录下,存在文件的增删改其中一种情况。 需获取待更新数据集的id,支持通过如下两种方式获取: 创建
安全组是一个逻辑上的分组,为具有相同安全保护需求并相互信任的资源实例提供访问策略。通过为已创建的隔离域关联安全组,为隔离域提供访问策略,本章节介绍如何为隔离域关联安全组。 前提条件 已获取服务运维岗位权限、基础运维岗位权限或运维管理员权限,权限申请操作请参见申请权限。 已创建隔离域。 创建安全组
将已归档的弹性云服务器主机恢复至可用状态 取消弹性云服务器主机纳管 回收弹性云服务器及边缘云服务器主机 为主机新增或扩容云硬盘 回收云硬盘 管理华为云已释放的主机 父主题: 管理已纳管资源
管理华为云已释放的主机 在华为云上已经释放的主机,VMS不会同步释放,会作为冗余资源展示在VMS中。 查看冗余主机 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“运维 > 主机管理服务(VMS)”。 选择左侧导航栏的“云服务器管理 > 冗余主机”。 在“冗余主机”页面查看冗余主机。
> CCE集群管理”。 选择“纳管集群”页签,单击“集群同步”,将弹性资源(ERS)中的集群同步过来。 单击“确定”。 删除CCE集群 介绍如何删除CCE集群。 进入AppStage运维中心。 单击,选择“微服务开发 > 微服务平台”。 选择左侧导航栏的“环境管理 > CCE集群管理”。
环境准备 操作步骤 在华为云控制台,完成如表1所示的资源购买。 表1 资源列表 资源名称 说明 参考文档 CCE集群 购买1个CCE集群。 根据业务需要选择规模,本实践中选择集群规模为50节点。 购买集群 ECS服务器 购买1个ECS服务器,容灾场景下购买2个ECS服务器。 根据
请参考将已有模型部署为模型服务进行部署,部署后即可进行调测(体验)、调用。 第三方厂商闭源模型,例如GLM系列、Moonshot系列等。 请先参考如何对模型供应商提供的模型服务设置鉴权设置鉴权,再进行调测(体验)、调用。 父主题: AI原生应用引擎
warehouse:选择warehouse类型后,可以基于数仓中创建的指标或视图配置图表。 Cluster 使用数据源选择需要使用的集群。 Database 选择数据存储的数据库。 数据源名称 选择数据表的表名。 数据源路径 数据表路径,可以不设置。 令牌ID 填写已申请的令牌ID 口令 填写申请的令牌。 父主题: