针对AI大型模型对错误答案“过于自信”的问题，麻省理工学院提出了一种新的高效低耗的校准方法。

编辑日期：2024年07月31日

根据今日的MIT NEWS报道，麻省理工学院（MIT）与MIT-IBM Watson AI Lab的研究人员提出了一种专门针对大型语言模型的校准方法。这种方法被命名为“温度计”（Thermometer），它通过在大型语言模型之上建立一个较小的辅助模型来进行校准工作。

针对ai大型模型对错误答案过于自信的问题

据悉，这种方法被称为“温度计”法，它需要的计算能力较少，但同时能保持模型的准确性，并使模型在处理未曾遇到的任务时能够做出更好的校准响应。

通过针对各种任务对大型语言模型进行有效校准，“温度计”可以帮助用户识别出模型在错误预测时过度自信的情况，最终避免用户在可能出现失败的情况下部署该模型。

该论文的第一作者，麻省理工学院电子工程和计算机科学研究生沈茂豪（音译）表示，“我们希望给用户提供一个清晰的指示，表明模型的回答是准确还是不准确，以此来反映模型的不确定性，并让用户了解模型是否可靠。”

通过运用“温度计”，研究者们研发出一项多功能技术。该技术采用了一种名为“温度缩放”的传统校准方法，能有效对大型语言模型进行新任务的有效校准。这里，“温度”指的是一种缩放参数，其作用是调整模型的“置信度”，使其与预测准确率相匹配。

研究人员训练了一个辅助模型，该模型在大型语言模型的基础上运行，能够自动预测调整新任务所需的新“温度”。这个“温度计”仅需访问大型语言模型的一小部分内部信息，就能预测出针对特定任务数据点的合适“温度”，从而调整其预测结果。

该团队希望在未来能让“温度计”支持更复杂的文本生成任务，并将这项技术应用到更大型的语言模型上。

请提供需要重写的文本内容。

🔥AI副业赚钱星球