当前位置：首页 > 软件资讯 > 微软推出 “从错误中学习” 模型训练法，号称可“模仿人类学习过程

微软推出 “从错误中学习” 模型训练法，号称可“模仿人类学习过程

分区：软件资讯更新：2023-11-14 23:08:44

微软亚洲研究院联合北京大学、西安交通大学等高校合作，提出了一种名为“从错误中学习（LeMA）”的人工智能训练方法，以提高人工智能的推理能力。

微软推出从错误中学习模型训练法

微软推出从错误中学习模型训练法

OpenAI GPT-4 和Google aLM-2 等大型语言模型在自然语言处理(NLP) 任务和思想链推理的困难数学任务中表现良好，但LLaMA-2 和

像百川二号这样的开源大型模型在处理相关问题上仍需加强。

为了增强这些大型语言模型的思维链推理能力，研究团队提出了LeMA

方法。这种方法的核心是利用包含“错误答案”和“更正正确答案”的数据来微调相关模型。为了获得相关数据，研究人员收集了包括LLaMA和GPT系列的数据

5种不同大型语言模型的错误答案和推理过程。然后使用GPT-4作为校正器来提供正确的答案。

修改后的正确答案包括三类信息：原推理过程中的错误片段、原推理过程中错误的原因以及如何修改原方法以获得正确答案。

研究人员使用GSM8K 和MATH 在5 个开源大型模型上测试了LeMA 训练方法的效果。测试结果表明，改进后的LLaMA-2-70B

GSM8K 任务的准确率分别为83.5% 和81.4%，MATH 任务的准确率分别为25.0% 和23.6%。

鹿游戏网