新加坡国立大学发布 GOAT 模型，算数能力居于 GPT-4 之上

发布日期：2023-06-29 点击次数：153

IT之家 6 月 7 日消息，当下 GPT-4 模型最大的短板主要是算术能力，由于模型的逻辑推理能力尚待提升，因此即使是许多人认为相对简单的计算问题，GPT-4 却无法得出正确的结果。

近日，新加坡国立大学研究者推出了 Goat 模型，称该模型“专门用于算术问题”。研究人员表示“在对 LLaMA 模型进行微调后，Goat 在算数上实现了比 GPT-4 更高的准确度与更出色的性能”。

▲ 图源 Arxiv

研究人员提出了一种新办法，将任务根据算数的可学习型进行分类，然后利用基本算术原理将不可学习的任务分解为一系列可以学习的任务（IT之家注：把复杂的计算过程分点拆解成简单的步骤）后导入 AI 模型。

这种新方法可以令模型学习答题模式，并将过程泛化为看不见的数据，而非仅仅依靠纯粹的“权重记忆计算”，因此能够有效地提高算数性能，可以在零样本学习中以“近乎完美的精度”为大数加法和减法生成答案。

▲ 图源 Arxiv

研究人员在具备 24 GB 显存的 GPU 上进行训练，并将最终得到的模型使用 BIG-bench 算数子任务进行测试，准确率结果较为出众，领先于业内的 Bloom、GPT-NeoX、OPT 等模型。其中零样本的 Goat-7B 的准确率甚至一度超过了少样本学习后的 PaLM-540 模型，在大数计算方面远超 GPT-4。

IT之家的小伙伴们可以在这里找到论文的链接。

","gnid":"940d38b679aeb710d","img_data":[{"flag":2,"img":[{"desc":"","height":"993","title":"","url":"http://p2.img.360kuai.com/t01a021d0f41c2358cc.jpg","width":"1174"},{"desc":"","height":"540","title":"","url":"http://p1.img.360kuai.com/t0128dde9c4e9c6b6ef.jpg","width":"1075"}]}],"original":0,"pat":"art_src_1,fts0,sts0","powerby":"pika","pub_time":1686109820000,"pure":"","rawurl":"http://zm.news.so.com/7c67d37ba0e40e6bf779f2505f051438","redirect":0,"rptid":"3ce7d6897e867fef","rss_ext":[],"s":"t","src":"IT之家","tag":[{"clk":"ktechnology_1:新加坡国立大学","k":"新加坡国立大学","u":""}],"title":"新加坡国立大学发布 GOAT 模型，算数能力居于 GPT-4 之上","type":"zmt","wapurl":"http://zm.news.so.com/7c67d37ba0e40e6bf779f2505f051438","ytag":"科技:人工智能:AI技术","zmt":{"brand":{},"cert":"IT之家官方账号","desc":"爱科技，爱这里 - 前沿科技人气平台","fans_num":29241,"id":"2951916302","is_brand":"0","name":"IT之家","new_verify":"5","pic":"http://p2.img.360kuai.com/t0184531af38acf0f81.jpg","real":1,"textimg":"http://p9.img.360kuai.com/bl/0_3/t017c4d51e87f46986f.png","verify":"0"},"zmt_status":0}","errmsg":"","errno":0}

上一篇：库克称自己也在用 ChatGPT，苹果正密切关注其发展
下一篇：2022 年累计发现 25096 个漏洞，同比增长 25%