检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
动适配架构类型。 安全护栏 选择模式 安全护栏保障模型调用安全。若关闭,推理服务可能会有违规风险,建议开启。 选择类型 当前支持安全护栏基础版,内置了默认的内容审核规则,不可调整。 资源配置 实例数 设置部署模型时所需的实例数,单次部署服务时,部署实例个数建议不大于10,否则可能触发限流导致部署失败。
数进行更新,而其余参数保持冻结状态。这种方法可以显著减少计算资源和时间消耗,同时在很多情况下,依然能够保持较好的模型性能。 基础模型 选择微调训练所用的基础模型, 可在“从资产选模型”或者“从人物选模型”中进行选择。 高级设置 plog日志。plog日志是一种用来记录模型运行情况
集进行审核),确保标注结果经过验证和质量控制,提升数据的可靠性和可用性。同时,平台支持对视频类和图片类数据集进行AI预标注,标注员可以在此基础上进行审核和修正,从而有效减少人工标注的工作量,并保证原始数据集内容的完整性。 通过这些功能,平台不仅降低了标注成本,还为用户提供了灵活的
限,可切换空间查看其他空间内的资产。 在“数据发布”页签可查看数据资产,并可对数据集进行删除操作。单击数据集名称可进入详情页面查看数据集的基础信息和操作概览。 图1 查看数据资产 父主题: 管理盘古大模型空间资产
可选择“预训练”和“微调”。 基础模型 可以选择“从资产选模型”和“从任务选模型”,模型会自带时间分辨率,会根据预设的时间间隔处理和生成预测结果。 若训练类型为“预训练”,训练任务使用训练数据重新训练出与基础模型分辨率相同的模型。 若训练类型为“微调”,训练任务会使用训练数据在基础模型的基础上进行训练。
索出的文档完全相关,将其与query及特定prompt模板拼接后输入模型,观察输出是否符合预期。 选择基模型/基础功能模型 query改写模块:盘古-NLP-N1-基础功能模型 说明:该模块用于对多轮对话中的省略和指代问题进行补全,对多轮对话中的query进行改写。当前query
供您参考: 文本生成:对于文本生成场景(宣传文案生成、信稿文本生成、文学创作等),通常希望生成的文本有一点的多样性,建议在保证不过于随机的基础上,增大“温度”或“核采样”的值(二者选其一调整)。若发现生成的文本过于发散,可以降低“话题重复度控制”的值,保证内容统一;反之若发现内容
掌握其强大功能,助力您在不同领域实现创新,加速业务智能化升级。 产品介绍 什么是盘古大模型 产品优势 应用场景 产品功能 模型能力与规格 基础知识 03 入门 通过快速入门引导,您将快速熟悉平台的核心能力,探索多种应用场景,从而更好地发挥盘古大模型在实际业务中的价值。 快速入门
用盘古大模型的功能。企业可以根据自己的需求选取合适的大模型相关服务和产品,方便地构建自己的模型和应用。 数据工程工具链 数据是大模型训练的基础,为大模型提供了必要的知识和信息。数据工程工具链作为盘古大模型服务的重要组成部分,具备数据获取、清洗、配比和管理等功能。 该工具链能够高效
功能总览 功能总览 全部 数据工程工具链 模型开发工具链 应用开发工具链 能力调测 应用百宝箱 数据工程工具链 数据是大模型训练的基础,为大模型提供了必要的知识和信息。数据工程工具链作为盘古大模型服务的重要组成部分,具备数据获取、清洗、配比和管理等功能。 该工具链能够高效收集和处
的访问权限,可切换空间查看其他空间内的资产。 在“本空间”页签可查看模型资产,并可对模型进行删除操作。单击模型名称可进入详情页面查看模型的基础信息。 在“预置”页签可查看用户可使用的各类模型的预置资产。 图1 查看预置模型预置模型 单击模型,可在“版本列表”页签查看当前模型的历史
提高了资源的高效利用。 在平台中,空间资产指的是存储在工作空间中的所有资源,包括数据资产和模型资产。这些资产是用户在平台上进行开发和管理的基础,集中存储和统一管理的方式有助于提升操作效率,并确保资源的规范性与安全性。 数据资产:数据资产是指用户在平台上发布的所有数据集。这些数据集
整的解决方案,用于高效构建和管理数据集,其操作流程见图1、表1。这种全面的数据准备机制,确保了数据质量的可靠性,为各类模型开发奠定了坚实的基础。 图1 数据集准备与处理流程图 表1 数据集准备与处理流程表 流程 子流程 说明 导入数据至盘古平台 创建原始数据集 数据集是指用于模型
提供的数据发布功能,用户能够根据具体任务需求,灵活选择和定制数据发布格式,保证数据的兼容性与一致性,从而为后续的模型训练和应用部署奠定坚实基础。 支持数据发布的数据集类型 ModelArts Studio大模型开发平台支持发布操作的数据集类型如下: 文本类数据集,详见发布文本类数据集。
信息。 使用规则构建的优点是快速且成本低,缺点是数据多样性较低。 基于大模型的数据泛化:您可以通过调用大模型(比如盘古提供的任意一个规格的基础功能模型)来获取有监督场景。一个比较常见的方法是,将无监督的文本按照章节、段落、字符数进行切片,让模型基于这个片段生成问答对,再将段落、问
除了短视频风格的口播文案,营销文案还可以根据需求生成不同风格的文案,如小红书风格、知乎风格,或爆款标题等。 选择基模型/基础功能模型 盘古-NLP-N2-基础功能模型 准备训练数据 本场景不涉及自监督训练,无需准备自监督数据。 微调数据来源: 来源一:真实业务场景数据。 来源二:
户语义歧义性,提高数据处理的灵活性和便利性,降低人力开发成本、提升交付效率和查询性能,同时赋能精细化运营。 选择基模型/基础功能模型 盘古-NLP-N2-基础功能模型 准备训练数据 本场景不涉及自监督训练,无需准备自监督数据。 微调数据来源: 来源一:真实业务场景数据。 来源二:基于人工泛化的真实业务场景数据。
为什么微调后的盘古大模型总是重复相同的回答 当您将微调的模型部署以后,输入一个与目标任务同属的问题,模型生成了复读机式的结果,即回答中反复出现某一句话或某几句话。这种情况可能是由于以下几个原因导致的,建议您依次排查: 推理参数设置:请检查推理参数中的“话题重复度控制”或“温度”或
常见问题 使用java sdk出现第三方库冲突 当出现第三方库冲突的时,如Jackson,okhttp3版本冲突等。可以引入如下bundle包(3.0.40-rc版本后),该包包含所有支持的服务和重定向了SDK依赖的第三方软件,避免和业务自身依赖的库产生冲突: <dependency>
该平台,企业可根据需求选择合适的盘古NLP大模型、科学计算大模型等服务,便捷地构建自己的模型和应用 数据工程工具链:数据是大模型训练的核心基础。数据工程工具链作为平台的重要组成部分,具备数据获取、清洗、配比和管理等功能,确保数据的高质量与一致性。工具链能够高效收集并处理各种格式的