京东高管:大模型的难点不在技术追赶,而是产业突破

2023-07-14 09:00     观察者网

今日(7月13日)上午,京东在2023京东全球科技探索者大会暨京东云峰会上推出言犀大模型。据悉,与通用大模型相比,言犀大模型融合了70%的通用数据与30%的数智供应链原生数据,瞄准的是零售、物流、金融、健康、政务等知识密集型、任务型产业场景。

"某种意义上,我们的大模型相当于既做了通识教育,又读了四年专业性的本科教育",京东探索研究院院长、京东科技智能服务与产品部总裁何晓冬表示。大模型的难点不在技术追赶,而是产业突破。京东言犀大模型的产业实践,是京东非常关注的部分。

上周,2023世界人工智能大会(WAIC 2023)在上海落下帷幕。今年大会,全球大模型和生成式人工智能(AIGC)成为各界关注焦点,阿里、百度、京东、华为和科大讯飞等国内企业,都介绍了自己的解决方案。京东大模型到底有何不同,它是否能帮助京东成为AI领域的"新势力"?

关于京东大模型,京东高管们说了什么?

在推出言犀大模型的同时,京东还推出了一套大模型的完整工具,例如言犀AI开发计算平台、高性能存储平台云海和软硬一体虚拟化引擎京刚等;此外,京东还发布了两大服务平台,包括全新升级的优加DaaS和言犀智能服务平台,以及面向零售、金融、城市、健康、物流五大领域的行业解决方案。

京东的大模型之旅,现在到哪一步了?

据悉,对于大模型的应用实践,京东有明确的"三步走"规划。

目前,京东云已经基于内部实践构建了通用大模型;到今年年底这段时间,京东将经由高复杂场景大规模锤炼,迭代出扎实的产业服务;预计在2024年初,会将大模型能力向外部严肃商业场景开放。目前,京东已经走到第二步,并在内部取得了丰富的实践成果。

京东医疗大模型实景 京东科技直播截图

京东集团技术委员会主席、京东云事业部总裁曹鹏表示,虽然Chat类的大模型引发新一轮热潮,但对话、写诗、作画绝不是大模型的全部。在大会现场,曹鹏展示了京东言犀大模型及其在零售、物流、健康、营销等场景的应用。"作为一家新型实体企业,京东思考更多的是大模型如何与实体结合。"

曹鹏认为,与通用大模型相比,言犀大模型具备三大特性:更高产业属性、更强泛化能力和更多安全保障。曹鹏表示,依托于京东复杂场景的历练,言犀天然具有产业基因,更懂产业需求,可为千行百业输出更准确、更有价值的信息和判断,与实体产业深度融合。

 "从产业端切入大模型,如同从北坡攀登技术珠峰,道路虽然更加艰难,却有更波澜壮阔的风景。"京东集团CEO许冉表示,"大模型真正实现自己的价值,一定是在产业应用中。"在许冉看来,大模型的价值=算法×算力×数据×产业厚度的平方。

"前三个指标固然重要,但技术在产业场景落地应用,创造实际价值才是关键。当产业效率和产业的边界拓展得到质的提升以后,大模型才有了更重要的实际价值和意义,这将不亚于又一次工业革命。"

京东集团CEO许冉演讲

在京东看来,数智供应链训练了产业大模型,而大模型则依托供应链深入产业。

供应链的链条长,带来的数据相关性比较高,而基于供应链的训练数据越多,模型越大,才有可能产生产业端的智能涌现;同时,以大模型为代表的人工智能技术,可以实时感知和动态调节供应链的运行状态,加速供应链上下游各主体之间的业务协同,进而提升供应链的响应速度和运行效率,这也是优化供应链最行之有效的方法之一。

百花齐放?中国和美国共占全球大模型的80%

京东不是唯一一家提出"聚焦产业"的大模型赛道玩家。

今年6月,腾讯首次公布腾讯云行业大模型研发进展。依托腾讯云TI平台打造行业大模型精选商店,腾讯为客户提供MaaS(Model-as-a-Service)一站式服务,助力构建专属大模型及智能应用。

腾讯的解题思路是:行业大模型+企业精调,以腾讯云的大模型算力作为硬支撑,在腾讯云TI平台内置多个高质量行业大模型,提供企业结合自身场景数据按需定制精调,大幅降低大模型应用门槛。

今年4月,阿里云宣布启动"通义千问伙伴计划",有意将"千问专属大模型"在不同行业中进行训练和落地。"专属大模型"不仅具备"通用大模型"的知识和能力,还拥有对应行业和场景的知识积累,能更好地支撑垂直行业各式各样的应用与服务,满足不同企业对大模型的特殊要求。

通过产品化的方式,阿里云希望能让"千问专属大模型"覆盖企业全生命周期,同时让每一个企业、每一个行业都能够用上自己的大模型。企业可以结合自己的行业知识及场景需求,对千问大模型进行再训练和精调,打造企业的专属大模型。

知名企业纷纷涌入大模型赛道,是当下中国大模型进入快速发展期的写照。

中国科学技术信息研究所所长赵志耘曾表示,"从全球已发布的大模型分布来看,中国和美国大幅领先,超过全球总数的80%。美国近年来一直排名第一,中国从2020年起进入快速发展期,目前与美国保持同步增长态势。"

赵志耘团队此前编写的《中国人工智能大模型地图研究报告》显示,我国大模型呈现蓬勃发展态势,在地域和领域分布上相对集中。全国有14个省(市)在开展大模型研发,其中北京、广东两地的大模型产品分别达到38个和20个,居全国前列。

报告显示,从模型领域发布来看,自然语言处理是最为活跃的领域;其次是多模态领域,在计算机视觉和智能语音等领域的大模型还较少。从研发主体发布来看,高校、科研机构、企业等创新主体都在积极研发大模型,但学术界与产业界的联合研发案例较少。

今日关注
更多