检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
《华为云安全白皮书》详细介绍华为云安全性的构建思路与措施,包括云安全战略、责任共担模型、合规与隐私、安全组织与人员、基础设施安全、租户服务与租户安全、工程安全、运维运营安全、生态安全。 图1 华为云安全责任共担模型 父主题: 安全
en长度超过向量化模型的token数,则知识库向量化失败)。 SMART_MODE(如果分片的token长度超过向量化模型的token数,则自动对超长部分进行截断处理)。 DEFAULT_MODE(如果分片的token长度超过向量化模型的token数,则大模型对超长部分进行重写;
冻结”,您将无法对处于保留期的按需计费资源执行任何操作。 保留期到期后,如果您仍未支付账户欠款,那么ChatGLM3-6B大模型服务API在线调用、大模型微调服务API在线调用-SFT局部调优将无法再使用。 图1 按需计费AI原生应用引擎资源生命周期 华为云根据客户等级定义了不同客户的宽限期和保留期时长。
固定阈值:简单设置上限或者下限值。一旦数据超过上限或是低于下限则发生异常。 动态阈值:通过训练历史数据,实现对数据特征的学习,构建数据的模型。并利用模型来预测数据的趋势走向。当实际值和预测值相差过大,认为异常。 上限 当算法类型选择固定阈值时,需要设置上限。 下限 当算法类型选择固定阈值时,需要设置下限。
GE参数,表示在Agent调用工作流时,引入图片作为工作流的请求参数,支持上传的图片大小为20M。图片参数的描述是大模型识别图片的关键信息,删除描述可能会导致大模型无法识别。 节点备注 输入节点备注信息,方便后续查阅节点功能。 父主题: 工作流基础节点说明
选中模板某指标,进入“应用模板”页面。 在“应用模板”页面,完成字段映射,如表2所示。 表2 字段映射 参数 说明 模型显示名 在数据分析或监控系统中显示的模型名称,通常是一个更易于理解和识别的字符串。 源表 指需要从中抽取数据的源数据表。选择源表后,单击源表后面的,可添加引用表,如表3所示。
如果您已开启“自动续费”功能,为避免继续产生费用,请在自动续费扣款日(默认为到期前7日)之前关闭自动续费。 按需计费资源 对于按需计费模式的资源,例如按需计费的大模型微调服务API在线调用-SFT局部调优,如果不再使用这些资源且需停止计费,请删除相应资源。 退订包年包月资源以停止计费 登录AppStag
ApplicationCenter 实例化 表1 实例化参数 参数名 参数类型 是否必选 参数描述 base_url str False 模型网关开放的IP和端口,有默认值可以不填。功能类似OpenAI的base_url。 custom_hearders dict False 其他自定义请求头信息。
AppStage开发中心的计费项为套餐包;AppStage的运维中心、运营中心的计费项由套餐包及对应的扩展包、增量包组成;AI原生应用引擎的计费项为模型或套餐包。了解每种计费项的计费因子、计费公式等信息,请参考计费项。 续费 包年/包月AppStage服务在到期后,会影响AppStage的
L读取从库或者主库等 √ AI原生应用引擎SDK功能介绍 表5 AI原生应用引擎SDK功能矩阵 接口类型 接口名 函数名 Python 大模型相关接口 文本生成 ModelRouter.chat.completion.create √ 向量生成 ModelRouter.embeddings
可以为空,为空则使用默认值。枚举值:VECTOR_RAG(向量RAG,是一种结合了向量化和大语言模型的RAG技术)、GRAPH_RAG(知识图谱RAG,是一种结合了知识图谱和大语言模型的RAG技术)。 默认取值: VECTOR_RAG。 retrieval_config 否 RetrievalConfig
Resource-code Resource-code 接口 modelrouter.chat 调用文本对话模型服务 modelrouter.embeddings 调用文本向量化模型服务 knowledgeBases.query.embeddata 检索知识库数据 请求消息体 请求消息
AI原生应用引擎SDK介绍 AI原生应用引擎面向开发者提供了一套搭建原生应用的Python SDK,包含了模型调用,知识获取,工具调用等功能。开发者可以使用SDK调用AI原生应用引擎的各种能力,快速构建大模型应用。 AI原生应用引擎SDK获取地址:wiseagent-dev-sdk-python。
只支持pdf、txt、docx等文本文件格式。 默认取值: 不涉及。 memory 否 Array of memory objects 参数解释: 在本次对话请求中,让大模型提前记住的部分。 约束限制: 不涉及。 取值范围: 不涉及。 默认取值: 不涉及。 user_id 否 String 参数解释: 用户id
KnowledgeRetriever 实例化 表1 实例化参数 参数名 参数类型 是否必选 参数描述 base_url str False 模型网关开放的ip和端口,有默认值可以不填。功能类似OpenAI的base_url。 custom_hearders dict False 其他自定义请求头信息。
个组件还是协同工作的多个组件,您都可以在Kubernetes上的一组Pod中运行它。在Kubernetes中,工作负载是对一组Pod的抽象模型,用于描述业务的运行载体,包括Deployment、StatefulSet、DaemonSet、Job、CronJob等多种类型。 无状态
选“自动续费”。 在“计费模式”区域下,选择“按需计费”或“包年/包月”。 当“订购方式”选择“自由订购”时,执行此步骤。 按需计费:在“模型”区域,勾选要购买的资源。 包年包月:选择套餐包并配置规格,选择购买时长,根据需求勾选“自动续费”。 在“协议许可”区域勾选“我已阅读并同
选“自动续费”。 在“计费模式”区域下,选择“按需计费”或“包年/包月”。 当“订购方式”选择“自由订购”时,执行此步骤。 按需计费:在“模型”区域,勾选要购买的资源。 包年包月:选择套餐包并配置规格,选择购买时长,根据需求勾选“自动续费”。 在“协议许可”区域勾选“我已阅读并同
在“模板详情”页面,选中模板某指标,进入“应用模板”页面。 在“应用模板”页面,完成字段映射,如表4所示。 表4 字段映射参数说明 参数 说明 模型显示名 在数据分析或监控系统中显示的模型名称,通常是一个更易于理解和识别的字符串。 源表 指需要从中抽取数据的源数据表。选择源表后,单击源表后面的,可添加引用表,如表5所示。
辅助开发过程规范有序且可追溯。 规划补丁版本缺陷 针对补丁类型的版本规划需要解决的缺陷。 规划版本需求 使用内置的多种开箱即用的场景化需求模型和对象类型录入版本开发相关的需求/任务。 5 开发版本 管理交付件 进行交付件管理等,保证版本开发过程阶段性成果沉淀以及过程可追溯。 创建代码仓