ChatGPT大升级!GPT-4可在考试中击败90%的人类,太太太太强了

2023-03-15 09:41  今日头条

一觉醒来,万众期待的GPT-4,它来了!

OpenAI老板Sam Altman直接开门见山地介绍说:

这是我们迄今为止功能最强大的模型!

有多强?

根据OpenAI官方的介绍,GPT-4是一个超大的多模态模型,也就是说,它的输入可以是文字(上限2.5万字),还可以是图像。

(看图)手套掉下去会怎样?

它会掉到木板上,并且球会被弹飞。

甚至只需要简单在纸上画一个网站的草稿图:

拍一张照片上传给GPT-4,它就可以立马生成网站的HTML代码!

在性能表现上,OpenAI直接甩出一句话:

在各种专业和学术基准上和人类相当!

而且不只是发布GPT-4这么简单,OpenAI这次"啪的一下"把相关"大动作"一步到位了:

  • ChatGPT Plus:集成GPT-4的ChatGPT升级版

  • 发布GPT-4的API

  • 公布技术论文 * 公开System Card

不仅如此,传闻的"必应早就用上了GPT-4"在今天也得到了微软方面的证实:

没错,确实是这样的!

不得不说,自打ChatGPT问世以来,微软和谷歌之间打响的数轮科技战役,微软这次又双叒叕赢麻了。

甚至这一次,不少网友都发出了"见证历史"的感慨:

史上最强大模型

正如之前传言,GPT-4确实拥有多模态能力,可以接受图像输入并理解图像内容。

并且可接受的文字输入长度也增加到3.2万个token(约2.4万单词)。

升级之后,GPT-4在各种职业和学术考试上表现和人类水平相当。

比如模拟律师考试,GPT-4取得了前10%的好成绩,相比之下GPT-3.5是倒数10%。

做美国高考SAT试题,GPT-4也在阅读写作中拿下710分高分、数学700分(满分800)。

那么GPT-4这些新能力实际用起来是什么样的?技术报告中也给出不少展示。

首先,看图能力可以用来解释表情包、梗图。

提问这张图哪里好笑?GPT-4可以按顺序描述出每一格的内容,并总结出笑点:

用巨大的过时VGA接口给小巧的现代智能手机充电。

更进一步,GPT-4可以理解图表中数据的含义,并做进一步计算。