“大模型训练一次就要花500万美元”。


(资料图片仅供参考)

今年2月,原美团联合创始人王慧文高调入局AI时,就曾因为5000万美元的资金遭到过一阵“嘲讽”。

两个月过去了,这股始于ChatGPT的AIGC浪潮不仅没有偃旗息鼓,反而愈演愈烈。越来越多的互联网大佬下场创业,体量较小的企业也纷纷推出自己的大模型。围观者惊叹,原来高投入的大模型从来都不只是“大厂之间的游戏”。

“诸神之战”

一天之内,大模型领域迎来了三位重量级的嘉宾。

先是搜狗公司创始人王小川,一封公开信正式宣告了“百川智能”的诞生。据了解,百川智能旨在打造中国版的OpenAI基础大模型及颠覆性的上层应用。

紧接着,两家公司先后官宣。在当天的技术交流日上,商汤科技董事长兼CEO徐立展示了“日日新”体系下的语言大模型“商量”,据悉,这是一个1800亿参数的中文大语言模型,可实现多轮对话、逻辑推理、语言纠错、内容创作、情感分析等。

与此同时,昆仑万维(300418)也表示,即将推出对标ChatGPT的双千亿级大语言模型“天工”3.5,并定于4月17日启动邀请测试。当晚,昆仑万维发布2022年年报,明确提到“未来10年将坚定的‘All in’AGI与AIGC”。

大模型成了这一轮AIGC浪潮的兵家必争之地。百度“文心”、阿里“通义”、腾讯“混元”、京东“ChatJD”、华为“盘古”,传统大厂无一掉队。

垂直领域诸多企业纷纷入局,除商汤科技及昆仑万维外,科大讯飞(002230)也在互动平台表示,将于5月6日发布讯飞预训练大模型的详细信息,大模型将用于教育、翻译等领域。

互联网大佬们更不畏惧大模型的“从0到1”。公开报道显示,王慧文的 “光年之外”A 轮融资后估值已达到10亿美元,前商汤科技副总裁闫俊杰新公司MiniMax的首款大模型产品 Glow累计用户已突破百万。

华西证券(002926)研报总结了现有国产大模型的两个特征:一是头部厂商主导,To B为主要模式,赋能原有优势业务;二是均未对公众大面积开放,未有明确的ToC入口,实际水平不透明。

通用还是垂直

AIGC产业主要分为基础和应用两个层面,前者包含理论框架的搭建、大模型的训练以及算法等,大投入、智力密集和长期性三个特点缺一不可。而后者主要是将别人开发出的东西与自己的业务进行整合,见效快,成本相对也较低。

而这也是当下中国AIGC企业押注的两个方向,有人势要成为中国的OpenAI,但也有人将目光瞄准了垂直领域的应用。

天使投资、资深人工智能专家郭涛表示,根据AI大模型应用范围的不同,可以分为通用型大模型和产业型大模型,通用型AI大模型在企业级与消费级市场都拥有广泛的应用场景,如OpenAI旗下的ChatGPT;而产业型的AI大模型主要应用于垂直行业或细分应用场景,如京东旗下的ChatJD。

“整体来看,通用型大模型应用场景相比产业型大模型更为广泛,随着规模化、多样化应用场景的落地,促使算法模型快速迭代升级,不断丰富和拓展新的应用场景,市场竞争力也将会不断增强。”郭涛认为。

但全联并购工会信用管理委员会专家安光勇则提到,通用大模型在应对多样化任务时具有竞争力,而专业大模型在特定领域有深厚的技术积累和应用优势。

安光勇认为,体量相对较小的企业在大模型领域与“大厂”抢的主要是技术创新和应用场景的拓展。相较于大厂,“小厂”在技术创新上通常更加灵活和敏捷,能够迅速响应市场需求,快速推出具有差异化和竞争力的大模型产品。

此外,小厂在应用场景上可能更加专业化和垂直化,能够深入某一领域或行业,提供定制化的解决方案,满足特定客户的需求。此种专业化和灵活性为小厂在大模型领域与大厂竞争中带来了一定的优势。

“‘大厂更适合做模型’其实是一种惯性思维。”元语智能联合创始人兼COO朱雷解释称,通用的大模型解决不了具体行业的问题,尤其是在国内,大部分高质量中文语料都在行业内,而不在公域的互联网内,即便是大厂也很难拿到行业数据,从这个角度上看,专用的模型在特定领域的效果一定要比大公司的通用模型更合适。

“这也决定了,在发展的过程中,大厂和初创公司的机会都是均等的。双方都会选择自己擅长的领域,再慢慢扩大,就看是谁先在这上面演化出了更优秀的产品。可以断定的是,在这个巨大的浪潮面前,无论是初创企业还是大厂,都不会错过这一波机遇。”朱雷补充称。

AIGC该降温了?

不久前,国际权威咨询机构IDC发布的《2022中国大模型发展白皮书》中预测,2026年中国人工智能软件及应用市场规模将达到211亿美元,人工智能进入大规模落地应用关键期。数据显示,自2020年起,中国的大模型数量骤增,仅2020-2021年,中国大模型数量就从2个增至21个,和美国量级同等,大幅领先于其他国家。

萨摩耶云科技集团首席经济学家郑磊认为,在通用大模型方面,中美存在时间差,而应用层则各有千秋。大模型训练成本高,初创企业目前投入的资金很快就会消耗光,需要多轮融资,而商业应用前景不确定,这类投资不太适合存续期较短的创投基金投资,“建议政府将其作为新基建项目,引导社会资金共同投资”。

此外,郑磊提到,由于还存在可能替代大模型的其他技术路线,国家也应关注,及时加强研究支持,缩小与欧美技术差距。对于中小企业来说,可以根据市场定位和行业发展趋势,选择已有的合适的大模型作为垂直应用研发的基座,逐步形成AI赋能的产品和服务,借助市场力量推动产品研发,形成在细分领域的竞争优势。

上个月末,一览科技推出业界首个基于GPT大模型的“文本+图片+虚拟人”视频AIGC全域工作流,彼时,一览科技创始人兼 CEO 罗江春就曾提到,AIGC工具只会越来越多,同质化非常严重,说是新一轮“百团大战”也不为过,关键的问题是谁能解决某一个垂直领域用户的根本需求。

“大模型需要降温了。”于资本市场,深度科技研究院院长张孝荣做出了这样的判断。在他看来,大模型是人为炒作起来的一个现象,前期是国际巨头推广产品,后期是国内资本市场跟进,炒作相关企业股价,许多公司股价脱离理性轨道,在短短几个月的时间内翻了数倍,导致资本市场发烧。

推荐内容