当前位置：首页 > 软件资讯 > OpenAI 推出 GPT-4 大型语言模型诸多测试中表现比人类都好

OpenAI 推出 GPT-4 大型语言模型诸多测试中表现比人类都好

分区：软件资讯更新：2023-03-22 15:07:56

GPT-4可以更准确地解决你的问题。多模态GPT-4还可以生成和编辑创意或技术文章，在高级推理方面优于其前辈(当前开放版本的ChatGPT基于GPT-3.5)。当然，正如大家猜测的那样，微软NewBing的聊天功能确实是基于GPT-4的。

此外，该公司正在与其合作伙伴Be My Eyes测试GPT-4的图像输入能力(注:Be My Eyes是一款即将推出的智能手机应用程序，可以识别和描述场景，类似于常见的AI地图的增强版)。

除了介绍网站，OpenAI还提供了描述GPT-4功能的技术论文和详细描述其局限性的系统模型卡。

OpenAI 推出 GPT-4 大型语言模型1.jpg

OpenAI计划通过ChatGPT及其商业API为用户提供GPT-4的文本支持，但仍需等待。IT之家需要提醒您的是，GPT4目前仅适用于ChatGPT plus账号，因此您可以选择GPT4模式进行通话，并且每4小时限发100条消息。

收费方面，750字左右的提示收费3分钱左右，750字左右的回复收费6分钱(即问题和答案的差价)。

OpenAI 推出 GPT-4 大型语言模型2.jpg

OpenAI声称ChatGPT-4在迭代前比GPT-3.5“更大”，这意味着它接受了更多的数据训练，在模型文件中有更多的权重(参数)，这也使得它的运行成本更高。

该公司声称，这种模式“比以往任何时候都更具创造性和协作性”，“能够更准确地解决问题”。它可以解析文本和图像输入，尽管它只能通过文本进行响应。

就任务而言，GPT-4比它的前辈表现得更好。它可以遵循自然语言的复杂指令，并生成技术或创意内容，并且它可以进一步做到这一点:它支持多达32，768个标签(约25，000个文本单词)的生成和处理，从而实现比其前辈更长的内容创建或文本分析。

OpenAI承认，该公司使用了微软Azure平台Azure来训练其模型，微软已经在OpenAI上投入了数十亿美元。OpenAI以比赛为由，没有透露具体的模型大小或用于训练它的硬件。这些细节可以用来重建模型。

官方表示，GPT-4的错误答案更少，也会降低偏离题目的可能性，尽量不谈论禁忌话题，甚至在很多标准化测试中的表现都优于人类。

例如，GPT-4在模拟律师考试中排名前10%，在SAT阅读考试中排名前7%，在SAT数学考试中排名前11%。相比之下，律师考试中GPT-3.5的分数一般是倒数10%左右。当然，他们考研究生也没问题。

当然，AI终究是AI，OpenAI也说了，GPT-4目前还不完善，很多场景下的能力还不如人类。

说模型还是有“假象”或者捏造事实的问题，事实上并不总是可靠的。"它倾向于坚持自己是正确的，即使它是错的."OpenAI表示，GPT-4正在试图解决其局限性，如社会偏见、幻觉和敌意回复。

在一次随意的谈话中，GPT的3.5级和GPT的4级几乎没有区别。当任务的复杂程度达到足够的阈值时，差异就会出现:GPT-4比GPT-3.5更可靠，更有创造力，可以处理更细致入微的指令。"

OpenAI表示，该公司已经与几家公司合作，将GPT-4集成到他们的产品中，包括Duolingo、Stripe和Khan Academy。这种新模式通过OpenAI的ChatGPT订阅服务ChatGPT Plus向用户开放，每月收费20美元，并为微软的Bing聊天机器人提供动力。同时，GPT-4也将作为API的一部分提供，允许程序员将AI集成到自己的应用程序中。

上一篇：LG 推出新款 gram +view 便携显示器 16 英寸 2.5K 分辨率

下一篇：iOS 16.4与iPadOS 16.4 RC版本发布新增多种表情符号