重磅!OpenAI推出GPT-4,更加可靠、稳定且有创造性

2023-03-15 09:12     今日头条

重磅!OpenAI发布了GPT-4!GPT-4能力和技术相关信息汇总!

2023年3月14日(咱们北京时间应该是3月15日凌晨了),OpenAI发布了GPT-4模型。本文率先带大家看一下相关信息。

关于GPT-4的模型卡信息:https://www.datalearner.com/ai-models/pretrained-models/GPT-4

  • 一、基本能力
  • 二、GPT-4的测试结果
  • 三、GPT-4的多语言特性
  • 四、GPT-4的训练过程
  • 五、GPT-4的训练过程可预测
  • 六、GPT-4的开放及其他信息

一、基本能力

与之前系列最大的不同,GPT-4是一个多模态模型,可以接受图像与文本的输入,输出文本内容。

GPT-4在很多专业和学术基准上表现与人类差不多,比如通过模拟的律师考试,得分在应试者前10%左右(GPT-3.5在后10%,也就是说提升了很多)!但是在现实世界中的很多场景表现还不如人类。

基于之前模型训练的经验,GPT-4的训练是基于重建的深度学习堆栈进行的,因此训练过程可以稳定预测!

二、GPT-4的测试结果

与GPT-3.5相比,他们的区别可能不是那么明显,但是当任务足够复杂时候,它们的区别就明显了,GPT-4更加可靠、稳定且有创造性!

下图是GPT4、GPT-4(不带vision)和GPT-3.5的各种考试结果对比

可以看到,GPT4效果更好。

传统的机器学习任务中,GPT-4表现更好。

这里可以看到,在专业学术问答(MMLU)、日常推理(HellaSwag)、多项选择考试(AI2 Reasoning Challenge)等方面,GPT-4比GPT-3.5高出了一大截。在AI不太擅长的Python编程、阅读理解方面也有较大提高。

三、GPT-4的多语言特性

GPT-4的多语言能力也有较大提升,在MMLU的多选测试中,GPT-3.5的英文题目准确率70.1%,而GPT-4是85.5%。但是在其他语言上,GPT-4性能也很强。

今日关注
更多