当前位置:首页 > 软件资讯 > OpenAI 推出 GPT-4 大型语言模型 诸多测试中表现比人类都好

OpenAI 推出 GPT-4 大型语言模型 诸多测试中表现比人类都好

分区:软件资讯 更新:2023-03-22 15:07:56

GPT-4可以更准确地解决你的问题。多模态GPT-4还可以生成和编辑创意或技术文章,在高级推理方面优于其前辈(当前开放版本的ChatGPT基于GPT-3.5)。当然,正如大家猜测的那样,微软NewBing的聊天功能确实是基于GPT-4的。

此外,该公司正在与其合作伙伴Be My Eyes测试GPT-4的图像输入能力(注:Be My Eyes是一款即将推出的智能手机应用程序,可以识别和描述场景,类似于常见的AI地图的增强版)。

除了介绍网站,OpenAI还提供了描述GPT-4功能的技术论文和详细描述其局限性的系统模型卡。

OpenAI 推出 GPT-4 大型语言模型1.jpg

OpenAI计划通过ChatGPT及其商业API为用户提供GPT-4的文本支持,但仍需等待。IT之家需要提醒您的是,GPT4目前仅适用于ChatGPT plus账号,因此您可以选择GPT4模式进行通话,并且每4小时限发100条消息。

收费方面,750字左右的提示收费3分钱左右,750字左右的回复收费6分钱(即问题和答案的差价)。

OpenAI 推出 GPT-4 大型语言模型2.jpg

OpenAI声称ChatGPT-4在迭代前比GPT-3.5“更大”,这意味着它接受了更多的数据训练,在模型文件中有更多的权重(参数),这也使得它的运行成本更高。

该公司声称,这种模式“比以往任何时候都更具创造性和协作性”,“能够更准确地解决问题”。它可以解析文本和图像输入,尽管它只能通过文本进行响应。

就任务而言,GPT-4比它的前辈表现得更好。它可以遵循自然语言的复杂指令,并生成技术或创意内容,并且它可以进一步做到这一点:它支持多达32,768个标签(约25,000个文本单词)的生成和处理,从而实现比其前辈更长的内容创建或文本分析。

OpenAI承认,该公司使用了微软Azure平台Azure来训练其模型,微软已经在OpenAI上投入了数十亿美元。OpenAI以比赛为由,没有透露具体的模型大小或用于训练它的硬件。这些细节可以用来重建模型。

官方表示,GPT-4的错误答案更少,也会降低偏离题目的可能性,尽量不谈论禁忌话题,甚至在很多标准化测试中的表现都优于人类。

例如,GPT-4在模拟律师考试中排名前10%,在SAT阅读考试中排名前7%,在SAT数学考试中排名前11%。相比之下,律师考试中GPT-3.5的分数一般是倒数10%左右。当然,他们考研究生也没问题。

当然,AI终究是AI,OpenAI也说了,GPT-4目前还不完善,很多场景下的能力还不如人类。

说模型还是有“假象”或者捏造事实的问题,事实上并不总是可靠的。"它倾向于坚持自己是正确的,即使它是错的."OpenAI表示,GPT-4正在试图解决其局限性,如社会偏见、幻觉和敌意回复。

在一次随意的谈话中,GPT的3.5级和GPT的4级几乎没有区别。当任务的复杂程度达到足够的阈值时,差异就会出现:GPT-4比GPT-3.5更可靠,更有创造力,可以处理更细致入微的指令。"

OpenAI表示,该公司已经与几家公司合作,将GPT-4集成到他们的产品中,包括Duolingo、Stripe和Khan Academy。这种新模式通过OpenAI的ChatGPT订阅服务ChatGPT Plus向用户开放,每月收费20美元,并为微软的Bing聊天机器人提供动力。同时,GPT-4也将作为API的一部分提供,允许程序员将AI集成到自己的应用程序中。


  • 最新资讯
  • 最新软件