检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
平台提供导入知识功能,支持用户存储和管理数据,并与AI应用进行互动。支持多种格式的本地文档(如docx、pptx、pdf等),方便导入至知识,为Agent应用提供个性化数据支持。 平台还提供全链路信息观测和调试工具,支持开发者深入分析Agent执行过程中的每个环节。通过对信息进行分层展示,帮助开发者优化AI应
模型优化与部署:将训练好的大模型部署到生产环境中,可能通过云服务或本地服务器进行推理服务。此时要考虑到模型的响应时间和并发能力。 模型监控与迭代:部署后的模型需要持续监控其性能,并根据反馈进行定期更新或再训练。随着新数据的加入,模型可能需要进行调整,以保证其在实际应用中的表现稳定。 在应用阶段,除了
资源费用组成。了解每种计费项的详细信息,请参考计费项。 续费 包周期资源到期后,如果您想继续使用服务,需要在保留期内进行手动续费,否则不能再对已过保留期的服务进行续费操作,需重新购买对应的服务。了解更多关于续费的信息,请参见续费。 欠费 在使用云服务时,账户的可用额度小于待结算的
都包括输入和期望的输出。 LoRA 局部微调(LoRA)是一种优化技术,用于在深度学习模型的微调过程中,只对模型的一部分参数进行更新,而不是对所有参数进行更新。这种方法可以显著减少微调所需的计算资源和时间,同时保持或接近模型的最佳性能。 过拟合 过拟合是指为了得到一致假设而使假设
横向比较提示词效果 设置候选提示词 横向比较提示词效果 父主题: 开发盘古大模型提示词工程
免模型对某些类别的偏倚。可以通过过采样、欠采样或生成合成样本来调整类别比例 例如:情感类别多分类任务,通过对“中立”情感进行过采样、对“消极”、“积极”情感进行欠采样调整比例。 表2 平衡数据前 情感类别 数据占比 消极 45.3% 积极 37.8% 中立 16.9% 表3 平衡数据后
实例数。选择缩实例升级时,系统会先删除旧版本,再进行升级,期间旧版本不可使用。 图2 升级模式 升级配置后,需重新启动该部署任务,升级模式即为重启的方式。 模型部署实例扩缩容 完成创建专业大模型部署任务后,可以对已部署模型的实例进行扩缩容,具体步骤如下: 登录ModelArts
来分解复杂推理或数学任务,在问题的结尾可以加上“分步骤解决问题”或者“让我们一步一步地思考”,以引导大模型进行逐步的推理和解答。 通过上述指令,将一个推理任务拆解分步骤进行,可以降低推理任务的难度并可以增强答案可解释性。另外,相比直接输出答案,分步解决也容许大模型有更多的“思考时间”,用更多的计算资源解决该问题。
例数。选择缩实例升级时,系统会先删除旧版本,再进行升级,期间旧版本不可使用。 图2 升级模式 升级配置后,需重新启动该部署任务,升级模式即为重启的方式。 模型部署实例扩缩容 完成创建科学计算大模型部署任务后,可以对已部署模型的实例进行扩缩容,具体步骤如下: 登录ModelArts
例数。选择缩实例升级时,系统会先删除旧版本,再进行升级,期间旧版本不可使用。 图2 升级模式 升级配置后,需重新启动该部署任务,升级模式即为重启的方式。 模型部署实例扩缩容 完成创建NLP大模型部署任务后,可以对已部署模型的实例进行扩缩容,具体步骤如下: 登录ModelArts
各模块人员进行不同层级的权限配置,确保每个用户在其指定的工作空间内,拥有合适的访问与操作权限。这种精细化的权限管理方式,既保证了数据的安全性,又提高了资源的高效利用。 在平台中,空间资产指的是存储在工作空间中的所有资源,包括数据资产和模型资产。这些资产是用户在平台上进行开发和管理
大模型使用类 盘古大模型是否可以自定义人设 如何将本地的数据上传至平台 导入数据过程中,为什么无法选中OBS的单个文件进行上传 如何查看预置模型的历史版本 训练/推理单元与算力的对应关系是什么
在编排工作流时,可以使用以下节点进行功能设计: 开始节点:开始节点是工作流的起始节点,用户输入的信息由开始节点传入。 结束节点:结束节点是工作流的最终节点,用于定义整个工作流的输出信息。 大模型节点:用于在工作流中引入大模型能力。 意图识别节点:用于根据用户的输入进行意图分类并导向后续不同的处理流程。
利用预训练文本生成问答对。 图1 预训练文本类数据集合成指令参数配置示例 指令编排完成后,单击右上角“启用调测”,可以对当前编排的指令效果进行预览。 指令调测完成后,单击“创建并启动”,平台将启动合成任务。 当数据合成任务运行成功后,状态将从“运行中”变为“运行成功”,表示数据已经完成合成操作。
解决的逻辑。 引导模型分析:如果没有直接的示例或现有示例不适用,可以引导模型首先进行“详细分析”,然后再给出答案。这意味着在提示词中明确要求模型逐步分析问题的各个方面,帮助模型消耗更多的计算资源进行全面推理。这样,模型能够在多个推理步骤后得出更准确的结论,而不是直接跳到最终答案,减少了过度简化或跳跃推理的可能性。
rts Studio大模型开发平台的模型开发中使用。 如果使用该数据集训练盘古大模型,请将选择格式配置为盘古格式。 填写数据集名称、描述,设置扩展信息后,单击“确定”执行数据集发布操作。 当任务状态显示为“运行成功”时,说明数据发布任务执行成功,生成的“发布数据集”可在“数据工程
rts Studio大模型开发平台的模型开发中使用。 如果使用该数据集训练盘古大模型,请将发布格式配置为盘古格式。 填写数据集名称、描述,设置扩展信息后,单击“确定”执行数据集发布操作。 当任务状态显示为“运行成功”时,说明数据发布任务执行成功,生成的“发布数据集”可在“数据工程
在“调用详情 > 调用链”中查看插件输出的错误信息。 解决方法:若为Token错误问题,可参考创建多语言文本翻译插件,重新获取Token并进行试运行。 父主题: 低代码构建多语言文本翻译工作流
默认值:0 词汇重复度控制 用于调整模型对频繁出现的词汇的处理方式。调高参数会使模型减少相同词汇的重复使用,促使模型使用更多样化的词汇进行表达。 默认值:0 历史对话保留轮数 选择“文本对话”功能时具备此参数。表示系统能够记忆的历史对话数。 默认值:10 如图1,输入对话,单击“生成”,模型将输出相应的回答。
”。 数据加工:数据加工旨在通过使用数据集加工算子对数据进行预处理操作,针对不同类型的数据集,平台设计了专用的加工算子,以确保数据符合模型训练的标准和业务需求。 数据合成:数据合成利用预置或自定义的数据指令对原始数据集进行处理,并根据设定的轮数生成新的数据。 数据标注:数据标注旨