大模型“混战”正在进入白热化阶段。
根据科技部日前发布的《中国人工智能大模型地图研究报告》,中国研发的大模型数量排名全球第二,仅次于美国,其中国内10亿参数规模以上的大模型已发布79个。
(相关资料图)
“人工智能大模型行业中所谓的泡沫不是坏事情,我们不怕大家一哄而上,但是就怕一哄而下。”6月27日,中国科学院院士、阿里云创始人王坚在接受等媒体采访时表示,当下的确有大量的玩家处于这一赛道之内,但在行业退潮之时,有几个能留在这里仍是未知之数。
“能否留下来,资金已经不是最主要的问题,真正的挑战在于创新与人才。”王坚说道。
事实上,无论是海外还是国内,当下涉足大模型的企业都在疯狂延揽人才。据薪酬网站Levels.fyi统计的数据显示,OpenAI为软件工程师提供的年薪中值已经高达92.5万美元,而李开复、王小川、王慧文等中国知名创业者与科技投资人在日前也纷纷飞往硅谷,开启“挖人大战”。
在这一背景之下,国内人工智能领域的“工程师红利”与相关人才供给问题再次成为业内讨论的焦点。
“在科技迅猛发展的背景下,教育也面临着一定的转型。这其中存在两方面的问题,首先是怎样把学生基础的理论扎得更深,其次是如何让学生的动手能力和分析能力更强,并和企业的需求结合起来。”复旦大学人工智能创新与产业研究院院长漆远在接受记者专访时表示,人才的实战能力是弥补高校与企业之间鸿沟的重要环节,而当下这一方面正在呼唤着智算平台等“硬件”的支持。
6月27日,国内高校最大的云上科研智算平台在复旦大学正式上线。该平台由复旦大学、阿里云等共同打造,名为CFFF(Computing for the Future at Fudan)。在王坚看来,这一模型的核心意义在于,中国高校首次拥有了和科技巨头一样的研究计算平台,研究真正进入了计算驱动的时代。
大模型时代的产学研联动
事实上,纵观技术的发展历史,尤其在计算以及通讯领域,高校与企业的合作已经成为了创新的源泉之一。
例如,IBM和哥伦比亚大学的合作诞生了计算机专业。MIT跟贝尔实验室的合作又让今天几乎每个大学工学院诞生了通信专业。
因此在王坚看来,此次复旦大学和阿里云合作的CFFF平台在公共云上的部署,对于高校建设科研计算平台也是一个重要的转折点和里程碑。
“在人工智能大模型时代,产学研的联动在本质上已经变成了 ‘创新’的联动,而创新越来越依赖于计算这一最基本的研究平台和基础设施。学校能拥有和企业一样的算力基础设施,公共云是非常重要的保证。”
记者了解到,当下很多研究都依赖于计算,但即便在美国,高校也不具备今天很多企业所具有的研究计算平台。很多国际知名高校还停留在用大型机或者个人PC做研究的阶段。“这不是选择什么云计算部署方式的问题,而是关系到我们对计算的认识。”王坚说道。
“今天千行百业对我们开放的问题远远多于大模型可以解答的问题。”在王坚看来,目前行业对于大模型的认知仍然有所局限,“业内提起大模型都是文本大模型,但这个世界不知道要比文本丰富多彩多少倍,这一局限背后就是大家认知还没有开放的问题。”
而公共云的部署方式有着其独特的优势所在。王坚表示,任何基础设施在发展过程中的开放性都是非常重要的,但是它开放的同时需要保证最基本的安全。
“不然的话大家一定会做的越来越封闭,越来越不像一个公共的产品,也不符合开放科学的实践原则。”
漆远则从高校的角度为记者进行了解释,他表示,如果没有相关工程师的运维,很多高校内的科学大装置无法正常的完成运行,而在工程师的协助下,科学家可以在上面进一步开发模型来推进真正的科学发现,以及进行科学的验证,因此这是一个双向的结合。
换言之,公共云在开放的同时保证了安全,而这样一个新型的大科学装置,其运维必须借助公共资源,才能高效低成本地部署。
公开资料显示,智能计算相较通用计算的投入成本、技术门槛更高,各环节投资规模合计可能高达数百亿元。可以说,智能算力成本是通用算力的10倍以上。非公共云的模式变得更不可持续。
据介绍,CFFF平台由面向多学科融合创新的AI for Science智能计算集群“切问”一号和面向高精尖研究的专用高性能计算集群“近思”一号两部分组成——借助阿里云的大规模异构算力融合调度技术、分级存储技术、AI与大数据一体化技术,连成了一台真正意义上的“超级计算机”。
其中,阿里云乌兰察布数据中心以公共云模式为复旦校内多学院的多个科研项目提供超千卡并行智能计算,支持千亿参数的大模型训练。千卡并行的有效算力达到行业领先的92%,可拓展性达到万卡,万卡并行有效算力也可达90%。
人工智能与创新文化
事实上,当下“百模大战”的竞争已经不仅仅局限于企业领域,旺盛的人才需求也为国内乃至于海外的顶尖高校抛出了一个难题。
而在传统认知中“文理见长,工科较弱”的复旦大学此次如此积极布局大模型基础设施,也体现着国内高校在相关人才培养上的创新胆识。
中国科学院院士、复旦大学校长金力在接受记者采访时表示,复旦大学在传统的工科领域的优势并不明显,因此学校也在积极抢抓新技术带来的学科变革,培养更多“新工科”下的专业人才。
那么,新工科和传统工科又存在着哪些差别?
金力解释称,“新工科”下的人才不仅仅要能够用成熟的技术、材料或者产品去实现普遍的发展,其还必须具备把原创的东西通过工程化变成未来产品的能力。一言以蔽之,就是“将那些原来公众认知中没用的东西变成有用的产品。”
“大模型可以用更多、更好的数据发现一些原来并没有看到,也并不了解的新的规律,但仅仅发现这个东西是没有用的,它需要学科的专家在随后跟进验证,并且去挖掘它的规律,这才是科学。所以AI for 科学的本质是,一方面用AI发现规律,发现规律的线索,另一方面则是去验证并且解决科学问题。”金力说道。
记者在现场了解到,目前,CFFF平台上的第一个科研成果已经诞生。复旦大学人工智能创新与产业研究院李昊团队近期发布了45亿参数量的中短期天气预报大模型,预测效果在公开数据集上首次达到业界公认的ECMWF(欧洲中期天气预报中心)集合平均水平,并将预测速度从原来的小时级缩短到了3秒内。“基于CFFF平台的千卡并行智能计算,这样一个规模的大模型只用一天就完成了训练。传统的计算平台是很难做到的。”李昊说。