94亿，AIGC最大并购案诞生

观点

2023

07/24

12:31

亚设网

导语：大数据巨头公司Databricks宣布亿13亿美元的价格（约合94亿人民币）收购生成式AI初创公司MosaicML。该笔发生在美国硅谷的收购案，为年内生成式AI领域内公布的最大一笔。引来业界高度关注。

近日，大数据巨头公司Databricks宣布亿13亿美元的价格（约合94亿人民币）收购生成式AI初创公司MosaicML。该笔发生在美国硅谷的收购案，为年内生成式AI领域内公布的最大一笔。引来业界高度关注。

MosaicML于2021年成立于美国旧金山，其刚成立不久便成功完成了第一轮融资，知名风投DCVC、Lux Capital、Future Ventures等投资机构参与，MosaicML共获得3700万美元的融资。

第一轮融资时，MosaicML公司估值为2.2亿美元，但在此次收购中，MosaicML的估值直接提高近6倍，令业界感到惊叹。

成立不到两年，估值便如此之高，这家生成式AI初创公司到底有何“看家本领”？

AI模型服务企业端

产品质优价廉

根据公开资料显示，MosaicML的产品组合包括开源的、商业授权的MPT Foundation系列模型和MosaicML 推理和训练服务。

其推出的MosaicML Composer开源的深度学习库，提供20种用于计算机视觉和自然语言处理的方法，包括模型、数据集和基准。推出的MosaicML Explorer可以帮助开发人员探索和理解不同的云服务和硬件选项之间的时间、性能和成本，以简化和评估实施选项。推出的MosaicML AI开发平台，提供了成本效益高的模型部署和定制训练，同时保证数据安全，使用户能够拥有模型的所有权等。

值得一体的是，MPT基础模型系列是MosaicML 提供的一系列开源、商业可用的大型语言模型，它们可以作为用户构建自己的生成式AI应用的基础。

MosaicML 的MPT基础模型系列包括MPT-7B 和MPT-30B 两个模型，分别有70亿和300亿个参数。

MPT-7B是MosaicML在今年5月5日发布的类ChatGPT开源大语言模型。MPT-7B 在MosaicML平台上进行了9.5天的训练，零人工干预，成本仅用了20万美元。该模型具备可商业化、高性能、资源消耗低、1T训练数据、可生成代码等技术优势。

AI2、Generally Intelligence、Hippocratic AI、Replit 和 Scatter Labs等知名厂商皆使用MPT-7B开发各种生成式AI产品。

截至目前，MPT-7B开源项目的下载量超过300万次。收购方Databricks表示，这也是其收购MosaicML的重要原因之一。

另一款模型MPT-30B推出之后，同样引来业界关注，十分受欢迎。其训练成本远低于其他竞争对手，有望推动AI模型在更广泛领域的应用并逐步降低训练成本。

MosaicML首席执行官兼联合创始人Naveen Rao表示，MPT-30B的训练成本仅为70万美元，远远低于类似产品如GPT-3所需的数千万美元训练成本。该模型由于成本低、体积小，可以更快速地进行训练，并且更适合在本地硬件上部署。

MosaicML还介绍称，公司用 2 个月的时间训练了 MPT-30B，通过数据混合进行预训练，从 10 个不同的开源文本语料库中收集了 1T 个预训练数据 token，并使用 EleutherAI GPT-NeoX-20B 分词器对文本进行分词，并根据上述比率进行采样。

需要注意的是，开发者可以从Hugging Face下载并使用开源的MPT-30B基础模型，还可以使用自己的数据在本地硬件上进行微调。

MosaicML同时表示，将模型参数扩展到300亿只是第一步，随后他们将以降低更低成本推出更大体积、更高质量的模型。

MosaicML另一个比较有亮点的产品是今年推出的面向企业的MosaicML推理。

MosaicML首席执行官兼联合创始人Naveen Rao表示：“一些初创公司已经在使用MosaicML的模型和工具来构建自然语言前端和搜索系统。MosaicML允许企业使用公司的模型架构根据自己的数据训练模型，然后通过其推理API部署模型。如果客户训练了一个模型，他们可以放心，他们拥有该模型的所有迭代，该模型就是他们的。我们对此不拥有所有权。使用 MosaicML 的新推理产品，企业客户可以部署用于文本完成和文本嵌入的 AI 模型，其成本比使用OpenAI的LLM低4倍，而图像生成的成本比使用OpenAI的DALL-E 2便宜 15倍。”

“我们希望让尽可能多的人了解和使用这项技术，这就是我们的目标。这并不是排他性的。这不是精英主义。”Naveen Rao同时表示。

由英特尔前高管创立

MosaicML起点不低

作为初创公司的MosaicML，为何会连续推出爆款产品，这当然很其创始人有很大关系。

MosaicML是由曾在英特尔担任AI产品负责人、Nervana Systems 的联合创始人 Naveen Rao ，以及英特尔AI实验室的高级主管Hanlin Tang创立。

MosaicML的创始人Naveen Rao ，1997年毕业于杜克大学的计算机科学专业，后取得布朗大学神经科学的博士学位。Naveen Rao长期致力于人工智能神经网络的学习和开发，曾在高通担任过神经形态机器的研究员，并在2014年创立了人工智能公司Nervana Systems。后来这家公司在2016年以4.08亿美元被英特尔收购。

Hanlin Tang毕业于哈佛大学，研究人类视觉中的递归神经网络。他在普林斯顿大学取得物理学学士学位，随后在哈佛大学取得生物物理学的博士学位，研究人类视觉中的递归神经网络，Hanlin Tang少年时代在台北度过。后来加入英特尔后，在英特尔AI实验室担任高级主管，在此期间Hanlin Tang负责算法工程和深度学习研究，并参与了MLPerf基准测试的开发。

Hanlin Tang在国际顶级期刊和会议上发表了多篇论文，涉及计算神经科学、计算机视觉、自然语言处理和强化学习等领域。

还有一位值得一提的团队成员是MosaicML的首席科学家Jonathan Frankle，他是MIT计算机科学与人工智能实验室的博士后研究员，也是哈佛Kempner研究所的附属教员。Jonathan Frankle的研究方向是神经网络的学习动力学和训练算法，旨在提高大型语言模型（LLM）的效率同时降低训练成本。这一研究方向也正是MosaicML的核心竞争力所在，可以说Jonathan Frankle是MosaicML能卖到94亿的关键人物。

Naveen Rao和Hanlin Tang之所以能在英特尔任职，是因为Nervana Systems开发了Neon 这一高性能的深度学习框架，以及后来推出的Nervana Cloud深度学云平台、Nervana Engine专用硬件加速器，英特尔认为这些产品非常有价值，就把Nervana Systems收购了。Naveen Rao和Hanlin Tang也一起加入英特尔，一位成为了AI产品集团的负责人，一位成为了AI实验室高级主管。

不过，2020年英特尔宣布放弃原计划的Nervana服务器端AI加速芯片，去耗资20亿美元收购以色列公司Habana的产品。

在英特尔决定“抛弃” Nervana后，Naveen Rao和Nervana的前核心员工Hanlin Tang也一起离开了英特尔，两人另立门户创立了今天的MosaicML。根据LinkedIn的信息，目前Hanlin Tang担任MosaicML的CTO。

Databricks收购MosaicML

强强联合？

Databricks收购MosaicML不仅仅是因为商业价值，更是为了两个公司可以强强联合，实现技术上的突破，加码AI大模型。

先来看看收购方Databricks，这是一家数据存储和分析领域的巨头公司，由美国加州大学伯克利 AMP 实验室的 Spark 大数据处理系统多位创始人联合创立。Databricks 的客户遍及大中小企业，以及各个行业。截至 2023 年 03 月，其全球已有超过 9000 家企业用户。包括 AT&T、壳牌、巴宝莉、丰田、Walgreens、Adobe、康泰纳仕和再生元制药等。

2021 年，Databricks拿下了摩根士丹利旗下Counterpoint Global领投的16亿美元H轮融资。2023年4月18日，Databricks以298亿美元亿的估值入选《2023·胡润全球独角兽榜》，名列第七。

业内专家表示，收购完成之后，MosaicML 将成为 Databricks Lakehouse 平台的一部分，MosaicML 的整个团队和技术都将纳入 Databricks 旗下，为公司提供统一的平台来管理数据资产，助力 Databricks更好的开发生成式AI技术。同时能够使用自己的专有数据来构建、拥有和保护自己的生成式 AI 模型。

DataBricks 的 CEO Ali Ghodsi 也表示，收购 MosaicML 将进一步增强 DataBricks 的数据分析平台。

DataBricks收购MosaicML是为加码AI大模型是主流观点，原因是MosaicML因其尖端的MPT大语言模型而受到认可，MPT-7B和MPT-30B都是今年开发的爆款产品，下载量均突破百万。

值得一提的是，MosaicML的模型训练自动优化使得训练速度比标准方法快2-7倍，而资源的近线性扩展允许在几小时内训练多十亿参数的模型。

借助于双方的联合产品，Databricks和MosaicML的目标是将训练和使用LLMs的成本从数百万美元降低到数千美元。

由此可见，Databricks正试图加码AI大模型，去挑战OpenAI、微软、谷歌等大公司的市场地位，为行业带来新的选择。

但也有反对观点认为Databricks 整合 LLM 的价值主张是不太明确，因为Databricks主营Lakehouse，主要是用Spark来处理大规模集群数据，因此其整合大语言的价值并不明确。还有业内人士认为，Databricks 是在借当前大模型热度进行炒作，收购对技术方面不会有明显的突破，MosaicML 迟早会被Databricks放弃。

这起收购案能否能获得良好的效果，在实现商业价值的同时，也能有技术突破，可能仍需要等待时间去验证。

财经方面专家认为，收购MosaicML的交易可能是这家AI独角兽公司为IPO之路打下基础。

AI大模型并购潮拉开大幕

去年末ChatGPT的横空出世，拉开了AI竞赛的大幕，半年之后，又出现了AI并购潮。

原因无外乎是生成式AI经过一段时间的野蛮生长，然后大型企业取得一定的进展，同时也发现了现有技术和人才的不足，而那些AI初创公司，相对来说要专业一些，既有人才也有技术，但存在资金不足、资源稀缺等问题。所以AI并购潮现在出现是必然的，对于整个行业来讲也是正向的、有利的。

除了本文介绍的Databricks收购MosaicML之外，今年5月，云计算巨头Snowflake宣布收购了由两位前Google员工创立的生成式AI搜索初创公司Neeva。业内专家认为，此次收购将使Snowflake能够利用尖端的搜索技术，并将其注入到数据云中，充分客户、合作伙伴和开发者的需求。

值得一提的是，Neeva的领导团队成员在创建YouTube货币化和Google的搜索广告等产品时，起到了非常重要的作用。不出意外的话，此次收购将把Snowflake中的搜索和对话提升到一个新水平。不过此次收购的金额并没有对外公布。

6月26日，全球最大的专业信息服务提供商汤森路透宣布，以6.5亿美元现金收购AI初创公司Casetext，该公司主营业务是为法律人士提供AI助理服务。

公开资料显示，Casetext员工数为104名，客户包括1万多家律师事务所和企业法务部门。其主要产品CoCounsel是一款于今年推出的人工智能法律助理，由GPT-4提供支持。该笔收购将有效补充汤森路透现有的AI路线图。

6月29日，AI初创公司Inflection宣布完成13亿美元融资，该轮融资由微软、英伟达等牵头投资，其融资总额达到15.25亿美元。

再看中国的AI市场，6月29日，美团发布公告，宣布已完成光年之外境内外主体100% 的股权收购，耗资20.65亿人民币。

对于此次并购，美团在公告表示，光年之外是中国领先的AGI创新者，其目前的管理与技术团队具有开发深度学习框架的高水平经验。公司通过收购事项可以获得领先的AGI技术及人才，有机会加强其于快速增长的人工智能行业中的竞争力。