大模型在各行各业遍地开花,这一次轮到零售金融赛道。8月28日,消费金融巨头马上消费在金融大模型发展论坛中发布其“天镜”大模型,这也是国内首个零售金融大模型。
与传统通用大模型不同的是,金融大模型面对的更多是结构化的金融数据和知识图谱。用马上消费首席信息官蒋宁的话说即为,“我们希望任何情况下,大模型给出的回答是合规的,并且任何不可预期情况下,其给出的结果是稳定的。”
(资料图)
在论坛中,中国信通院、重庆国家应用数学中心还和马上消费牵头发起“金融大模型可信安全验证与联合创新行动计划”,参与这一计划的还包括阿里云、腾讯云、中国科学院自动化研究所等机构。
大模型还有四大难题待解
“金融行业人工智能应用要求高、场景丰富,是大模型技术和算法突破的沃土,”中国工程院院士倪光南在8月28日论坛上如是表述。
不过,在蒋宁看来,通用大模型在工业领域、金融领域,大模型还有四个关键难题待解。他表示,大模型目前还面临关键性任务和动态适应性、个性化要求和隐私保护、群体智能与安全可信和基础设施的能力四大难题。
“生成式大模型最大的问题是满腹经纶,回答错了可以不承担风险,”蒋宁直言。他以自动驾驶中的刹车、提速、转弯等操作为例,“随着外界环境不断变化,自动驾驶决策绝对不能出错,1%的错都会造成生命财产损失。”
蒋宁认为,金融大模型与自动驾驶的案例一脉相承,和传统大模型最大的区别是生成式模型不能做解释,但是金融大模型则具有判别性,“它需要做交易决策。”
他表示:“我们希望在任何情况下,给客户的回答都是合规的,并且任何不可预期情况下,结果是稳定的”。
欧洲科学院外籍院士、清华大学人工智能研究院常务副院长孙茂松也有类似看法。他表示,生成式人工智能目前的一大特点是一定会出错。因为通用大模型对文本语言比较重视,对数字并不敏感,而金融数据大部分是结构化知识图谱,所以通用大模型在金融领域有不少挑战。
形成“三纵三横”布局
基于此,马上消费在论坛上发布了国内首个消费金融大模型——“天镜”大模型。
蒋宁解释,天镜大模型的推出基础在于,马上消费作为以科技驱动的头部持牌消费金融机构,积累了1.79亿用户,已经有超2000个模型,10万+变量,近50PB多模态、高质量数据等,通过在这些自身数据上做模型精调对齐训练,同时再用推理加速技术实现模型可控,因此相对通用大模型更懂金融。
其次,他透露,在算力平台方面,马上消费现拥有近万台服务器和近千张GPU储存卡。
据悉,该模型已运行近3个月,意图理解准确率达91%,相较于传统AI的68%有较大提升。另外,“天镜”大模型目前客户参与率61%,高于传统模型43%的参与率,也高于人工坐席平均28%的水平。
例如,将企业招股书、财报、经济预测数据等文件上传后,“天镜”大模型可以深入解析金融领域专业术语、同时拥有查询定位多个不同文档、洞悉金融图表隐含的信息和强大归纳总结能力。
而且,大模型SQL生成平台不再需要代码等专业指令,可直接向AI发出自然语言。随后天镜自动理解需求、展开检索、生成答复,按照用户意思去完成数据挖掘任务。据透露,当前,天镜每日线上SQL生成数量650多次,线上SQL生成可执行比例53.4%,SPIDER标准数据集EX得分75.2,线上使用者满意反馈比例82.3%。
蒋宁表示,马上消费目前已形成“三纵三横”的大模型发展技术布局,并领航构建可信、合规、多模态、适配全域、泛化的金融大模型技术能力体系,聚焦行业领先的基础语言特性能力、逻辑和推理能力、语义理解、生成与创作、金融领域能力、安全与合规能力等六大核心领域,进一步推动金融数字化转型产生实质性提升。
所谓三纵,是指实时人机协作、多模态智能、数据决策智能,在数据领域实现智能化,实现结构性数据判别式模型的综合能力。三横即是指持续学习、模型合规、组合式AI形成安全、合规、可信的鲁棒性技术能力,确保让模型越用越聪明,同时更稳定、更安全可控。
打造全能数字员工
基于三纵三横,马上消费人工智能研究院院长陆全围绕打造全能数字员工这一核心,对天镜大模型在汇集智慧、唤醒知识、众创价值、数字分身四大应用场景进行了诠释。他表示,汇集智慧方面是应用人工客服主要场景。
“通过大模型提炼萃取一线优秀人工坐席客服经验,汇聚成群体智慧,从而拥有一对多服务客户的能力,也可作为人工坐席的辅助角色,帮助推荐、优化回答,”他表示。
他希望打造的“数字外表+智慧大脑+情感内心”三合一数字人,不仅擅理解、有温度、懂心理,而且还是不休不眠的智能“打工人”。
在他看来,每个员工都可以能轻松拥有自己数字分身,上传自己的资料并定制一些参数后,只需5分钟的训练数据就可以生成“另一个我”。随时可以被唤起,成为人人都拥有的超级助手,代替员工完成大量工作。