检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
基本概念 大模型推理服务 直接调用预置大模型提供API完成推理过程。 私有模型部署 针对已经微调训练好的模型,如需评测此模型效果,或通过应用调用此模型,则需将模型部署为线上服务。
模型调用与优化:详细流程说明请参见基于微调数据集进行模型微调、生成模型服务、创建模型服务。 提示语创建和优化:详细流程说明请参见创建提示语、对创建的提示语进行优化。 知识库构建:详细流程说明请参见创建知识数据集、创建知识库。 5 为您推荐 为您推荐的热门Agent、热门模型。
支持客户打通自己的业务能力API,将大模型的能力结合进入自己的业务链路。 提供支撑AI原生应用运行的整套模型工具链,包括数据管理、模型接入、模型调优、知识工程等能力,帮助客户选好、管好、用好大模型,从而提升大模型应用效果。
数据管理 数据管理中纳管了用户自定义的和平台预置的数据集,用户使用这些数据集进行模型训练、知识库构建等,快速完成平台使用并验证模型训练效果。 模型管理 用户可以自定义创建模型、模型服务及在线测试模型,检验模型的准确性、可靠性及反应效果。
无法访问选择的模型 检查模型是否已经正常部署 500 UniModel.Internal.0002 模型返回超时 模型服务返回超时 检查网络情况,或者减少模型返回内容 500 WS.00100001 AUTHENTICATION_ERROR 鉴权错误 检查访问权限 500 WS.00100002
2024年2月 序号 功能名称 功能描述 阶段 相关文档 1 AI原生应用引擎全新公测上线 AI原生应用引擎是一站式的企业专属AI原生应用开发平台,该平台面向企业的研发/技术人员,提供企业专属大模型开发和应用开发的整套工具链,包括数据准备、模型选择/调优、知识工程、模型编排、应用部署
支持客户打通自己的业务能力API,将大模型的能力结合进入自己的业务链路。 提供支撑AI原生应用运行的整套模型工具链,包括数据管理、模型接入、模型调优、知识工程等能力,帮助客户选好、管好、用好大模型,从而提升大模型应用效果。
表2 检索规划执行动作参数说明 参数 说明 输入 模型服务调用ID 执行检索规划所调用的模型。 对于资产中心预置的模型,在资产中心选择“大模型”页签,单击模型卡片进入模型详情页面,查看模型服务调用ID。
按需计费 千tokens * 每千tokens单价 推理单元 将基础或者预训练后的模型部署为在线服务时使用的算力单元,通过购买推理单元实现服务QPS扩容。 包年/包月 包年/包月:实例数量*实例单价*购买时长 大模型调用 大模型调用次数。
开发中心:开发中心专业版 运维中心:运维中心专业版、运维中心服务扩展包 运营中心:运营中心专业版、运营中心看板增量包、运营中心指标增量包-10个指标、运营中心指标增量包-100个指标 预置模型服务调用 API SaaS:ChatGLM3-6B大模型服务API在线调用 自定义模型训练
索引配置 向量化模型 选择向量化模型,向量化模型可以将文本数据转换为数值向量,常用于将文本转换为机器可以处理的形式,以便进行各种任务,如文本分类、情感分析、机器翻译等。
运营中心 应用数据接入一次性任务运行失败 应用数据接入周期性任务运行失败 AK/SK填写错误 数据模型修改或者删除失败 新建模型失败 应用指标摸板库生成指标运行失败
表1 API概览 类型 说明 模型调用 包含文本对话类、文本向量化类模型服务调用接口。 应用中心 包含Agent调用、用户配置(工作流、技能)调用、文件盒子等接口。 知识中心 包含知识库和知识数据集的创建、删除、执行及查询等接口。
更多 AI原生应用引擎 我创建的微调数据集会被其他用户调用去训练他们的大模型吗? 模型微调任务一直在等待中是什么原因? AI原生应用引擎支持所有数据集进行数据标注吗? 更多 开发中心 如何申请组织管理员权限? 团队无法关联某个服务是什么原因?
支持知识库容量,智能应用运行时引擎,开通ChatGLM3-6B服务、大模型调优服务API在线调用。
在异常检测任务模型配置的“算法配置”页面,查看“输出表名”改为新的系统自动创建的输出表。 在异常检测任务模型配置的“训练配置”页面,单击“立即训练”。 父主题: 异常检测Judge定时任务失败
AI原生应用引擎:查看工作空间、资产中心,管理我的模型、数据集与知识库、我的提示语,创建访问密钥等操作。
LLM模式下,将准备好的模型服务(必选)、工具、工作流及知识库等编排成Agent。 工作流模式下,用户与工作流进行对话,因此必须添加工作流,不支持添加模型、工具、知识库等配置。
API 模型调用 应用中心 知识中心
通过运营看板查看AI原生应用引擎资产总览 查看资产总览 查看模型调用统计 查看Agent调用统计