检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
中控模块:对(经过改写后的)用户输入query,进行意图识别,判断是否是政务问答场景问题。如果是,则控制流程调用检索模块,并将检索文档传输给问答模块以辅助增强问答模块的能力;如果不是,则控制流程不调用检索模块。 检索模块:输入待检索的query,输出从文档检索库中检索出来的文档以及对应
模型在输出时会从概率最高的词汇开始选择,直到这些词汇的总概率累积达到核采样值,核采样值可以限制模型选择这些高概率的词汇,从而控制输出内容的多样性。建议不要与温度同时调整。 温度 用于控制生成结果的随机性。调高温度,会使得模型的输出更具多样性和创新性;降低温度,会使输出内容更加遵循指令要求,但同时也会减少模型输出的多样性。
单击“生成”,模型将基于问题进行回答。 图1 使用预置服务进行文本对话 可以尝试修改参数并查看模型效果。以修改“核采样”参数为例,核采样控制生成文本的多样性和质量: 当“核采样”参数设置为1时,保持其他参数不变,单击“重新生成”,再单击“重新生成”,观察模型前后两次回复内容的多样性。
求。因此,针对该问题,需要严格控制数据质量。若输入(context字段)要求文案300字以内,则输出必须要满足300字以内。 问题二:模型生成的文案中重复讨论一个相同的话题。 解决方案:对于这种情况,可以尝试修改推理参数。例如,降低“话题重复度控制”参数的值。若调整推理参数不生效
的学习率,并逐步增加,直到达到预设的最大学习率。通过这种方式,热身比例能够避免初期更新过快,从而帮助模型更好地收敛。 学习率衰减比率 用于控制训练过程中学习率下降的幅度。 计算公式为:最低学习率 = 初始学习率 × 学习率衰减比率。 权重衰减系数 通过在损失函数中加入与模型权重大
溯源。另外平台还提供了完善的标签体系、支持数据按行业标准进行分类、按行业标准进行安全分级、内置场景分类标签。帮助用户进行数据分类、数据质量控制和数据资产管理,提升数据治理的效率和效果。 通过整合上述功能,数据工程在AI研发中不仅帮助用户高效构建高质量的训练数据集,还通过全流程的数
f(x))来表示,损失函数越小,模型的鲁棒性就越好。 推理相关概念 表3 训练相关概念说明 概念名 说明 温度系数 温度系数(temperature)控制生成语言模型中生成文本的随机性和创造性,调整模型的softmax输出层中预测词的概率。其值越大,则预测词的概率的方差减小,即很多词被选择的可能性增大,利于文本多样化。
型网格中每个单元格是否是陆地。 SOIL_TYPE:表示地表土壤分类,影响土壤的物理和化学特性,如水分保持能力、热容量和导热性。 模型输出控制参数 训练轮数 表示完成全部训练数据集训练的次数。每个轮次都会遍历整个数据集一次。取值范围:[1-1000]。 损失类型 用来衡量模型预测
整。 核采样 模型在输出时会从概率最高的词汇开始选择,直到这些词汇的总概率累积达到核采样值。核采样值可以限制模型选择这些高概率的词汇,从而控制输出内容的多样性,取值范围为0.1到1之间。 携带上下文轮数 设置带入模型上下文的对话历史轮数,轮数越多相关性越高。 输出模式 当前应用支
数据配置:选择构建微调训练任务数据集中构建的微调训练数据集,参考表1完成配置,配置示例如图2。 表1 训练参数说明 参数分类 参数名称 参数说明 模型输出控制参数 训练轮数 表示完成全部训练数据集训练的次数。每个轮次都会遍历整个数据集一次。 取值范围:[1-1000]。 损失类型 用来衡量模型预
的过程中,实时地将生成的文本发送给客户端,而不是等到生成完成后一次性将所有文本发送给客户端。 temperature 否 Float 用于控制生成文本的多样性和创造力。 参数的取值范围是 (0, 1],取值接近0表示最低的随机性,1表示最高的随机性。一般来说,temperatur
设置值 最大Token限制(max_token) 1024 温度(temperature) 0.3 核采样(top_p) 0.8 话题重复度控制(presence_penalty) 0 部署推理服务后,可以采用人工评测的方案来评估模型效果。如下提供了本场景可能存在的常见问题,若在评测过程中出现如下问题,可以参考解决: