检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
适用于数据加工,用于正则类算子加工。 不同数据加工算子所需数据资源类型详见数据集加工算子介绍。 按需(时长)计费、包年/包月 ModelArts Studio-数据智算单元 适用于数据加工,用于AI类算子加工。 不同数据加工算子所需数据资源类型详见数据集加工算子介绍。 按需(时长)计费、包年/包月
实例都包括输入和期望的输出。 LoRA 局部微调(LoRA)是一种优化技术,用于在深度学习模型的微调过程中,只对模型的一部分参数进行更新,而不是对所有参数进行更新。这种方法可以显著减少微调所需的计算资源和时间,同时保持或接近模型的最佳性能。 过拟合 过拟合是指为了得到一致假设而使
密协作,快速响应不断变化的业务需求和技术要求。 平台支持的数据类型 ModelArts Studio大模型开发平台支持的数据类型见表1,各类型数据格式详细要求请参考数据集格式要求。 表1 平台支持的数据类型 数据类型 数据内容 支持的文件格式 文本类 文档 txt、mobi、epub、docx、pdf
用路径,详见获取调用路径。 填写请求Header参数。 参数名为Content-Type,参数值为application/json。 参数名为X-Auth-Token,参数值为步骤1中获取的Token值。 参数名为stream,参数值为true。当前应用仅支持流式调用。 在Postman中选择“Body
发布格式,保证数据的兼容性与一致性,从而为后续模型训练和应用部署打下坚实基础。 支持数据发布的数据集类型 支持数据发布的数据集类型见表1。 表1 支持数据发布的数据集类型 数据类型 数据评估 数据发布 文本类 √ √ 图片类 √ √ 视频类 √ √ 气象类 - √ 预测类 - √
规格限制 资产、资源类型 规格 说明 模型资产、数据资源、训练资源、推理资源 所有按需计费、包年/包月中的模型资产、数据资源、训练资源、推理资源。 购买的所有类型的资产与资源仅支持在西南-贵阳一区域使用。 配额限制 盘古大模型服务的配额限制详见表2。 表2 配额限制 资源类型 默认配额限制
流。 - 通用文本(/text/completions) Java、Python、Go、.NET、NodeJs、PHP 给定一个提示和一些参数,模型会根据这些信息生成一个或多个预测的补全,还可以返回每个位置上不同词语的概率。它可以用来做文本生成、自动写作、代码补全等任务。 开发环境要求
选择压缩策略。除INT8压缩策略外,部分模型支持INT4压缩策略,可在选择模型后,根据页面展示的策略进行选择。 INT8:该压缩策略将模型参数压缩至8位字节,可以有效降低推理显存占用。 INT4:该压缩策略与INT8相比,可以进一步减少模型的存储空间和计算复杂度。 配置资源。选择计费模式并设置训练单元。
NLP大模型支持接入的数据集类型 盘古NLP大模型仅支持接入文本类数据集,数据集文件内容包括:预训练文本、单轮问答、多轮问答、带人设单轮问答、带人设多轮问答等,不同训练方式所需要使用的数据见表1,该数据集格式要求请参见文本类数据集格式要求。 表1 训练NLP大模型数据集类型要求 基模型 训练场景
进入“加工步骤编排”页面。对于视频类数据集,可选择的加工算子请参见表1。 在左侧“添加算子”分页勾选所需算子。 在右侧“加工步骤编排”页面配置各算子参数,可拖动右侧“”以调整算子执行顺序。 图1 算子编排 在编排过程中,可单击右上角“保存为新模板”将当前编排流程保存为模板。后续创建新的数据
进入“加工步骤编排”页面。对于气象类数据集,可选择的加工算子请参见表1。 在左侧“添加算子”分页勾选所需算子。 在右侧“加工步骤编排”页面配置各算子参数,可拖动右侧“”以调整算子执行顺序。 图1 算子编排 在编排过程中,可单击右上角“保存为新模板”将当前编排流程保存为模板。后续创建新的数据
以及区域范围,适用于想自定义自己的区域模型的场景,需预先准备好区域高精度数据。 微调:在已有模型的基础上添加新数据,它适用于不改变模型结构参数和引入新要素的情况,添加最新数据的场景。 本实践将以平台预置的区域海洋要素基模型为例,介绍盘古科学计算大模型的微调训练过程,该模型的基本信息详见表1。
显著加速大模型应用的开发流程,帮助企业快速应对复杂业务需求。 预置模型使用流程 ModelArts Studio大模型开发平台提供了不同类型的预置模型,包括NLP大模型和科学计算大模型。用户可将预置模型部署为预置服务,用于后续的调用操作。 其中,NLP预置模型使用流程见图1、表
进入“加工步骤编排”页面。对于图片类数据集,可选择的加工算子请参见表1。 在左侧“添加算子”分页勾选所需算子。 在右侧“加工步骤编排”页面配置各算子参数,可拖动右侧“”以调整算子执行顺序。 图1 算子编排 在编排过程中,可单击右上角“保存为新模板”将当前编排流程保存为模板。后续创建新的数据
进入“加工步骤编排”页面。对于文本类数据集,可选择的加工算子请参见文本类加工算子介绍。 在左侧“添加算子”分页勾选所需算子。 在右侧“加工步骤编排”页面配置各算子参数,可拖动右侧“”以调整算子执行顺序。 图1 算子编排 在编排过程中,可单击右上角“保存为新模板”将当前编排流程保存为模板。后续创建新的数据
dataset file type does not match standard file type. 请检查上传的数据集文件类型与平台要求的标准文件类型是否一致。 data management query dataset data invalid. 请检查数据集中是否有异常格式的数据。
了解更多常见问题、案例和解决方案 热门案例 如何对盘古大模型的安全性展开评估和防护? 训练智能客服系统大模型需考虑哪些方面? 如何调整训练参数,使盘古大模型效果最优? 如何判断盘古大模型训练状态是否正常? 为什么微调后的盘古大模型总是重复相同的回答? 盘古大模型是否可以自定义人设?
签,单击右上角“创建知识库”。 在“创建知识库”页面,填写知识库名称与描述,单击图片可上传知识库图标,单击“下一步”。 在“文件类型”页面,选择文件类型。 导入文本文档数据。支持上传txt、doc、docx、pdf、ppt、pptx格式的文本文档,要求单个文件不超过10M。 导入
提示工程是什么 大模型生成文本的过程可视为一个黑盒,同一模型下对于同一个场景,使用不同的提示词也会获得不同的结果。提示工程是指在不更新模型参数的前提下,通过设计和优化提示词的方式,引导大模型生成目标结果的方法。 为什么需要提示工程 模型生成结果优劣取决于模型能力及提示词质量。其中
低代码构建多语言文本翻译工作流 能力调测 盘古大模型提供了便捷的“能力调测”功能,用户可以体验平台预置的多种模型功能,如文本对话、科学计算功能。 平台还支持实时调整模型参数,以便更好地满足用户需求。 支持区域: 西南-贵阳一 使用盘古预置NLP大模型进行文本对话 应用百宝箱 应用百宝箱是盘古大模型为用户提供的