作者:娜娜邱


(资料图片仅供参考)

ChatGPT引发的AI大模型浪潮,引爆了AIGC市场,也带火了数据库、芯片等相关产业。作为一个致力于成为中国的国际智能数据算力公司,柏睿数据毫无疑问已经站在了风口上。柏睿数据董事长兼首席科学家刘睿民近日接受GPLP犀牛财经采访时表示,柏睿数据已经坚持“Data + AI”(数据+智能)技术战略多年,现在只是正好站到了人工智能的潮头上了。

标准先行并保持技术领先

刘睿民是在2014年全球数据库老大Oracle推出令人瞩目的数据库一体机Exadata X2、正如日中天时回国创立柏睿数据的。他当时认为,Oracle Exadata X2将传统关系型数据库的性能做到了极致,但这同时意味着传统数据库的技术周期已到,新的机会要来了。与此同时,当时互联网带来的海量数据的存储、计算成为IT业界的全新挑战,大容量、高并发的应用场景所占比重越来越大。作为一个标志性事件,长期受制于甲骨文数据库的SAP在2011年推出了内存数据库产品HANA。

此时的刘睿民密切关注着流数据库和内存数据库技术等前沿数据库技术。其中,流数据库是指以时间轴来定义流动数据的数据表,而非传统的静态定义的数据表,从而实现实时的数据分析和处理。带着让这种国际前沿技术在国内发展的美好愿望,刘睿民回国创了业。

此后的柏睿数据,标准制定、产品研发两条腿走路。

在标准方面,柏睿数据一直坚持标准先行。刘睿民本人更是主笔撰写了《SQL9075 2018流数据库》《AI-in-Database库内人工智能》两个国际标准,由此成为我国大数据领域的国际标准主笔第一人。柏睿数据站到了流数据库和库内人工智能标准的制高点上,掌握行业话语权和主动权。

当前,柏睿数据还是全国信标委数据库标准工作组分析型数据库专题组组长单位,正持续开展《分析型数据库系统技术要求》的起草、研制等相关工作。

技术创新是数据库创业企业生存和发展的关键因素之一。柏睿数据非常关注研发,过去几年研发的投入一直保持在营业收入的30%左右。正是在这样的背景下,柏睿数据拥有完全自主研发的分布式内存数据库和流数据库核心技术,并基于这两种技术推出数据智能产品体系。

在刘睿民看来,从2014年创业到现在近9年,柏睿数据基本上已经实现、甚至已经超出了创立时的预期,柏睿数据已经规模性市场扩张阶段,企业运营步入了健康发展的轨道。

不过,柏睿数据这9年的成长过程,并不是一帆风顺。这其中,有两个没想到对柏睿数据的发展带来了很大的影响:一是国际化发展没有达到预期,一是信创替代带来了巨大的应用空间。

资本市场遇阻但曙光已现

刘睿民创业时,非常前瞻地看好流数据库的发展前景,诸如亚马逊等国际巨头,也是在柏睿数据成立后才进入这一赛道。因此创业之初,刘睿民瞄准的是国际市场,其中包括国际化的资本市场。

但是后来国际环境风云变幻,美国对中国企业的融资变得警惕,因此柏睿数据只好面向国内资本市场进行融资。此时,柏睿数据就不得不面临两个问题:

一是国内创投资本通常追求短平快,可接受的投资周期通常为“5+2”。相比之下,对高科技领域创投有着丰富经验的美国等海外投资者,则通常采用“8+3”的投资周期。后者更适合高科技产业的发展特性;

二是国内资本市场对软件行业了解甚少。即便科创板已经开通,但投资者通常普遍更青睐于投资硬件厂商。“摸不着、看不见”数据库更是难上加难。

因此,融资难一度成为柏睿数据这样的资本密集型初创基础软件厂商发展的一大障碍。

不过,得益于信创替代带来的国产数据库应用热潮,以及柏睿数据本身坚持市场导向,顺势而为适时推出适销对路的产品,柏睿数据在资本运营没有达到预期目标背景下快速成长。

刘睿民强调,作为一个数据库厂商,柏睿数据很少为客户提供定制服务,而将定制服务交给前端的应用开发商。这种坚持对核心产品(数据库)进行投入的策略,一方面让柏睿数据将资源、精力更多地聚焦在核心竞争力的打造上,另一方面给合作伙伴留出了更多的合作空间。

幸运的是,随着ChatGPT的火爆出圈,越来越的资本关注到AI和数据库的巨大潜力。在国际市场上,近一个月内四家数据库初创企业均获得了新一轮融资:Pinecone完成1亿美元B轮融资,WeaviateBV获得5000万美元B轮融资,Chroma获得1800万美元种子轮融资,Qdrant获750万美元种子融资。在国内市场,去年上市的向量数据库厂商星环科技股价与3月6日的低点相比,一度翻倍。

与此同时,刘睿民认为,星环科技等数据库相关企业的成功上市,以及老牌数据库厂商达梦的上市注册,都加速了整个资本市场对软件,特别是对数据库的认知。

根据天眼查App的信息,柏睿数据本身也已经处于上市辅导阶段。

信创市场有惊喜且前景乐观

信创替代带来的巨大的应用市场基于是刘睿民创业以来遇到的第二个没想到。

柏睿数据以“全内存分布式计算引擎”为基础,打造了新一代高性能、标准化、全智能的数据智能产品体系,不仅能够支撑用户从国外数据库到信创数据库的平滑迁移、无感替换,还能带来更加高效、稳定的性能。

此外,柏睿数据还对数据使用成熟度较低、对数据处理自动化需求较高的智能制造等领域推出了数据库一体机产品。刘睿民告诉GPLP犀牛财经,该产品的价格是甲骨文名噪一时的一体机产品Exadata的一半,但性能提升了一倍。

刘睿民告诉GPLP犀牛财经,传统数据库厂商在市场上很少与柏睿数据出现交集,他们有他们优势领域并非柏睿数据重点关注所在。柏睿数据聚焦新一代开源数据库的信创替代,因为那些用户“已经被教育过”,能更好地接受柏睿数据先进的全内存数据库。

刘睿民补充说,传统数据库厂商通常只是将内存数据库作为一个增强型的补充。“国内提供全内存数据库的厂商,除了柏睿数据,目前我还没有碰到这一技术路线的其他厂商,由于这一领域的高技术门槛,完全有理由相信柏睿数据的技术优势还能保持几年”。

据悉,目前柏睿数据的主要应用市场包括金融、智能制造、电信运营、能源电力、交通等领域,这些领域市场更加开放,对性能的追求更高,柏睿数据的全内存数据库,正好契合他们的需求,且能深切感受到柏睿数据产品带来的性能变化。

据悉,柏睿数据智能数据算力产品已经完成了与鲲鹏、飞腾、龙芯、海光、兆芯等CPU,麒麟、统信、安超云等操作系统信创产业上下游企业的产品适配工作;加入国家信创工委会和北京、上海信创工委会,入驻华为鲲鹏智能数据产业联盟等国家级创新平台。

此外,柏睿数据还自产了基于申威CPU的主板,“实现与申威CPU的适配及自有的主板设计能力,也从另一个角度说明我们对整个CPU、操作系统、数据库技术栈的强大技术掌控能力。”刘睿民说,“说明我们的代码是完全自主可控的。”

拥抱大模型未来可期

当前,ChatGPT带动起来的大模型热、AI热更是将柏睿数据推到了风口浪尖。但是刘睿民告诉GPLP犀牛财经,柏睿数据自成立以来,一直都在坚持“Data + AI”(数据+智能)的技术路线,并进行长期投入;柏睿数据之前的坚持终于得到了回报。

刘睿民认为,未来五年将是AI大模型风起云涌的五年,AI大模型将带动新的产业发展和行业应用,垂直场景落地和大规模推广将进入跑马圈地阶段,加快构建数据智能底座是当务之急。

而柏睿数据早已有布局。他介绍,柏睿数据去年发布的4.3版本产品,就与AI大模型密切相关。柏睿数据独立自主研发的新一代高性能、标准化、全智能的数据智能产品体系,可为AI大模型发展提供从数据采集、存储、计算分析到模型训练、部署、应用的全生命周期解决方案,助力用户高效、安全构建部署AI大模型。

其中,柏睿数据RapidsDB是基于全内存分布式架构的智能算力分析引擎,支持大规模并行计算,具有高性能、高并发、高扩展性等特点,能够实现PB级规模数据存储与实时在线分析,以及3000亿条数据查询秒级响应。RapidsDB可为执行大规模数据训练任务的AI大模型提供实时的海量数据计算处理能力,降低模型训练时间和成本。

刘睿民还特别向GPLP犀牛财经介绍了AI低代码平台AIworkflow。他解释说,AIworkflow的推出是为了满足企业日益迫切的异构数据处理需求,以及顺应BYOC(Build Your Own Cloud,构建自己的云)的应用趋势。所谓BYOC,对于数据库来说,就是要将处理后的诸如chatGPT等公有数据并入企业的核心数据,以保证企业在采用大模型的时候核心数据的安全性。

此外,刘睿民认为,AIGC的蓬勃发展,将给流数据库带来更广阔的应用空间:

其一,流数据库可以更好地支撑AI大模型训练。流数据库可以快速接收数据流并进行实时处理,还能在不同的数据源之间实现数据流和数据交换,支持多节点并行计算,能够大大提高训练速度。

其二,AIGC将带来更加海量的数据,需要对这些数据进行分类以更好地发掘数据价值。流数据库可以自动地将新数据流中的数据与已有的分类进行匹配,高效地对新数据进行分类并存储,提高数据处理的实时性和效率。

如此看来,柏睿数据在AI领域大有可为。刘睿民最后表示,柏睿数据持续研究全球最前沿技术趋势,联合上下游企业共建国内数据智能产业生态,加速大数据和人工智能的创新应用。

推荐内容