重磅!OpenAI发布了GPT-4!GPT-4能力和技术相关信息汇总!
2023年3月14日(咱们北京时间应该是3月15日凌晨了),OpenAI发布了GPT-4模型。本文率先带大家看一下相关信息。
关于GPT-4的模型卡信息:https://www.datalearner.com/ai-models/pretrained-models/GPT-4
- 一、基本能力
- 二、GPT-4的测试结果
- 三、GPT-4的多语言特性
- 四、GPT-4的训练过程
- 五、GPT-4的训练过程可预测
- 六、GPT-4的开放及其他信息
一、基本能力
与之前系列最大的不同,GPT-4是一个多模态模型,可以接受图像与文本的输入,输出文本内容。
GPT-4在很多专业和学术基准上表现与人类差不多,比如通过模拟的律师考试,得分在应试者前10%左右(GPT-3.5在后10%,也就是说提升了很多)!但是在现实世界中的很多场景表现还不如人类。
基于之前模型训练的经验,GPT-4的训练是基于重建的深度学习堆栈进行的,因此训练过程可以稳定预测!
二、GPT-4的测试结果
与GPT-3.5相比,他们的区别可能不是那么明显,但是当任务足够复杂时候,它们的区别就明显了,GPT-4更加可靠、稳定且有创造性!
下图是GPT4、GPT-4(不带vision)和GPT-3.5的各种考试结果对比
可以看到,GPT4效果更好。
传统的机器学习任务中,GPT-4表现更好。
这里可以看到,在专业学术问答(MMLU)、日常推理(HellaSwag)、多项选择考试(AI2 Reasoning Challenge)等方面,GPT-4比GPT-3.5高出了一大截。在AI不太擅长的Python编程、阅读理解方面也有较大提高。
三、GPT-4的多语言特性
GPT-4的多语言能力也有较大提升,在MMLU的多选测试中,GPT-3.5的英文题目准确率70.1%,而GPT-4是85.5%。但是在其他语言上,GPT-4性能也很强。