检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在SLB中创建和管理负载均衡实例 在SLB中创建负载均衡实例 在SLB中配置SLB节点信息 在SLB中配置nginx.conf 在SLB中配置url重写/重定向 在SLB中配置内网段 在SLB中进行降级配置 在SLB中配置黑白名单 在SLB中进行限流配置 在SLB中配置负载均衡其他配置项
查看注册到CloudMap的服务信息 查看注册到CloudMap的服务列表 为微服务配置告警策略 父主题: 管理Cloud Map中的服务资源
查看和管理注册到CloudMap的微服务实例 查看注册到CloudMap的微服务实例列表 调整微服务实例状态 父主题: 管理Cloud Map中的服务资源
工作流基础节点说明 起始节点 调用子工作流 数据连接器 LLM 知识库 变量V2 控制 JSON构造器 Code代码 结束 父主题: 管理工作流
管理我的凭证 创建AK/SK访问密钥 创建API Key
管理工作流 创建工作流 工作流基础节点说明 工作流工具节点说明
生成模型服务 将已有模型部署为模型服务 接入模型服务 创建路由策略用于提供模型服务 父主题: 管理模型
版本变更记录 表1 版本变更记录 版本 变更类型 说明 0.0.1 - 第一次发布。 父主题: AI原生应用引擎SDK API
权限管理 如何申请组织管理员权限? 华为账号与华为云账号的区别是什么?
常见问题 表1 Cloud Map常见问题 问题 报错原因 解决办法 “code”:403,no permission to access 业务没有权限访问中间件资源 登录Cloud Map管理台查看资源的授权信息。 如果自身的服务或微服务不在授权范围内,则没有访问权限,需要确认
AI原生应用引擎SDK API 版本变更记录 SDK概述 快速开始 应用示例 modules模块 错误处理 日志处理
HttpxClient 实例化 表1 实例化参数 参数名 参数类型 是否必选 参数描述 base_url str False 模型网关开放的ip和端口,有默认值可以不填。功能类似OpenAI的base_url。 custom_hearders dict False 其他自定义请求头信息。
如何调用API 构造请求 认证鉴权 返回结果
管理产品与服务 在AppStage中管理产品 创建产品 在AppStage中管理服务 创建服务 在AppStage中管理微服务 创建微服务 在AppStage中管理产品视图
管理已关联组织的部门及成员 AppStage组织介绍 在AppStage中管理部门 在AppStage中管理成员
审计 支持云审计的关键操作 查询云审计事件
“已冻结”,您将无法对处于保留期的按需计费资源执行任何操作。 保留期到期后,如果您仍未支付账户欠款,那么ChatGLM3-6B大模型服务API在线调用、大模型微调服务API在线调用-SFT局部调优将无法再使用。 图1 按需计费AI原生应用引擎资源生命周期 华为云根据客户等级定义了不同客户的宽限期和保留期时长。
在SLB中创建流控服务 CPU过载控制OLC(Overload Control)是一种CPU过载调控机制。当CPU过载时,OLC能够对受监控协议报文和任务进行调控,通过不同优先级业务的合理规划和限制报文通过等方式,降低对CPU资源的消耗,并确保设备不会因为某种受监控协议或任务冲击
VectorRAG:向量RAG,是一种结合了向量化和大语言模型的RAG技术。VectorRAG将非结构化的数据转化为结构化的向量空间,利用向量库实现高效的信息检索。 GraphRAG:知识图谱RAG,是一种结合了知识图谱和大语言模型的RAG技术。GraphRAG能够处理各种类型
创建团队 在开发中心进行服务开发前,需要组织管理员创建一个团队,将团队关联需要开发的服务。一个团队只能归属一个部门,可以关联一个或多个服务。 前提条件 需要具备AppStage组织管理员角色权限,具体角色权限说明请参考用户角色和权限说明。 创建团队时需绑定团队归属部门并关联服务,