分区:软件资讯 更新:2023-11-14 23:08:44
微软亚洲研究院联合北京大学、西安交通大学等高校合作,提出了一种名为“从错误中学习(LeMA)”的人工智能训练方法,以提高人工智能的推理能力。
微软推出从错误中学习模型训练法
微软亚洲研究院联合北京大学、西安交通大学等高校合作,提出了一种名为“从错误中学习(LeMA)”的人工智能训练方法,以提高人工智能的推理能力。
OpenAI GPT-4 和Google aLM-2 等大型语言模型在自然语言处理(NLP) 任务和思想链推理的困难数学任务中表现良好,但LLaMA-2 和
像百川二号这样的开源大型模型在处理相关问题上仍需加强。
为了增强这些大型语言模型的思维链推理能力,研究团队提出了LeMA
方法。这种方法的核心是利用包含“错误答案”和“更正正确答案”的数据来微调相关模型。为了获得相关数据,研究人员收集了包括LLaMA和GPT系列的数据
5种不同大型语言模型的错误答案和推理过程。然后使用GPT-4作为校正器来提供正确的答案。
修改后的正确答案包括三类信息:原推理过程中的错误片段、原推理过程中错误的原因以及如何修改原方法以获得正确答案。
研究人员使用GSM8K 和MATH 在5 个开源大型模型上测试了LeMA 训练方法的效果。测试结果表明,改进后的LLaMA-2-70B
GSM8K 任务的准确率分别为83.5% 和81.4%,MATH 任务的准确率分别为25.0% 和23.6%。
2024-09-04
抖音商城怎么开通金卡权限
抖音商城怎么开通微信支付功能呢
抖音商城怎么开通店铺功能
抖音商城怎么开通店铺权限
2024-09-04
腾讯视频一加定制版
小辣椒正品导航永久
小凯TV电视盒子
序言游戏社区app