盘古大模型 PanguLargeModels-大模型开发基本概念:推理相关概念

时间:2025-02-12 15:02:13

推理相关概念

表3 训练相关概念说明

概念名

说明

温度系数

温度系数(temperature)控制生成语言模型中生成文本的随机性和创造性,调整模型的softmax输出层中预测词的概率。其值越大,则预测词的概率的方差减小,即很多词被选择的可能性增大,利于文本多样化。

多样性与一致性

多样性和一致性是评估LLM生成语言的两个重要方面。 多样性指模型生成的不同输出之间的差异。一致性指相同输入对应的不同输出之间的一致性。

重复惩罚

重复惩罚(repetition_penalty)是在模型训练或生成过程中加入的惩罚项,旨在减少重复生成的可能性。通过在计算损失函数(用于优化模型的指标)时增加对重复输出的惩罚来实现的。如果模型生成了重复的文本,它的损失会增加,从而鼓励模型寻找更多样化的输出。

support.huaweicloud.com/productdesc-pangulm/pangulm_01_0014.html