导语:百度正式发布大语言模型、生成式AI产品“文心一言”,在这时间点前后,与AI语言大模型相关的产品和创业消息可谓此起彼伏,新声不断。
3月16日,百度正式发布大语言模型、生成式AI产品“文心一言”,在这时间点前后,与AI语言大模型相关的产品和创业消息可谓此起彼伏,新声不断。
除了OpenAI公布最新版大型语言模型GPT-4、微软发布GPT-4平台支持的新AI功能Copilot外,国内方面,创新工场董事长兼CEO李开复宣布正在筹办全球化AI新公司Project AI 2.0,美团联合创始人王慧文的新AI创业公司光年之外正准备收购专注于通用性深度学习标准框架研发的一流科技。
“比如微软和Google就是竞争。但是它的思维方式是说,如果你已经很领先了,我最好别做一个跟你一样的东西,我如果通过创新做一个跟你不一样的东西来竞争,那才是我的本事。在中国,大家的思维方式更像是这条路你跑通了,我也跑同样的路,咱看看谁跑的快。”最近,百度创始人、董事长兼首席执行官李彦宏在接受36氪独家采访,谈及不同公司对科技创新的不同看法时说道。
在国内企业争相布局AI语言大模型方向赛道的当下,财经网科技梳理发现,目前国内企业对AI大模型的布局主要有两条路径,一条是训练自己的AI语言大模型,另一条是接入并借助前者通用技术,以丰富和创新企业的原有业务。
两条路径均有其发展的必然性,但在应用道路探索上也充满机会与挑战。
争相做自己的大模型
“全球大厂中百度是第一个发布的”,李彦宏在文心一言发布会上坦言,“从我自己在内测过程中体验到的文心一言的能力来说,确实不能叫作‘完美’”,发布是因为有市场需求——百度的各个产品线都在等待这样的技术,客户也在等待,因而需要尽早推出。
市场需求是第一生产力,百度是国内第一家正式发布AI语言大模型的公司,但并不是唯一一家布局该领域的公司。
据财经网科技不完全统计,目前国内已有十余家企业在该领域有所布局,这些企业包括互联网头部企业阿里巴巴、腾讯、华为、百度、字节跳动,AI公司商汤科技、科大讯飞、旷视科技以及新创业公司光年之外等。有的企业已经公开宣布大模型名称及应用领域,有的则是在孵化阶段。对于这些企业来说,争夺新技术的入口,从而抢占市场优势和话语权或是其目标之一。
据多家媒体消息,3月19日晚,李开复发朋友圈称,“Project AI 2.0的资金、算力陆续到位,新公司期权由新团队绝对主导,首批广招大模型、多模态、NLP、AI算法工程与研究、分布式计算/Infrastructure 等方向的顶级人才推荐自荐。”
谈及在该领域发力的原因,李开复在线下分享会上表示,“AI 2.0带来的平台型机会将比移动互联网大十倍,这也是中国第一次迎来平台竞逐的机会。新平台上所有用户入口和界面都将被重写,能够建立下一代平台的公司将会取得巨大的优势和话语权。”
今年2 月,美团联合创始人王慧文宣布成立北京光年之外科技有限公司,发布一纸“AI英雄帖”,宣布出资 5000 万美元组队,致力于打造中国版的 OpenAI。
值得留意的是,除了新创公司,头部互联网公司如华为、阿里巴巴等在此领域早已有所布局。
自2021年起,阿里达摩院先后发布多个版本的多模态及语言大模型。2022年,阿里达摩院推出AI开源社区“魔搭”(ModelScope),旨在打造下一代开源的模型即服务共享平台,致力降低AI应用门槛。今年3月22日,阿里在“魔搭”上线了“文本到视频生成扩散模型”,实现视频生成功能。
3 月 27 日,华为云官网显示,华为旗下的盘古系列 AI 大模型即将正式上线,盘古CV大模型首次兼顾了图像判别与生成能力,能同时满足底层图像处理与高层语义的理解需求。
“我觉得需要国内需要研发自己的大模型,大厂研究大模型是以我为主、为我所用,科研机构研究大模型可以开放或收费服务,类似OpenAI的服务模式。”
北京大学王选计算机研究所研究员赵东岩告诉财经网科技,绝大多数厂商都需要采用接入大模型的方式来获得技术加成,但ChatGPT因存在国别限制和意识形态问题,很难被国内厂商直接应用,还是接入国产/自主研发的大模型更加现实、稳定且具有可控性。因此,这可能是很多人加入到AI语言大模型“竞争”中的原因。
不过,赵东岩也坦言,企业一拥而上也存在一定风险,一方面是有大模型研究能力的研究人员有限,另一方面是这可能会导致硬件资源的重复投入,缺乏前期研究积累的机构应谨慎对待。
据了解,AI算力和大模型不仅面临高昂的硬件采购成本(芯片、服务器、智能算力集群)、模型训练成本(数据采集、人工标注、模型训练等)以及日常运营成本(网络带宽、电力资源以及人工成本),而且在算力支持上也存在“燃料”紧缺的情况。
中国科学院计算技术研究所研究员张云泉告诉财经网科技,目前语言大模型的训练主要使用英伟达的芯片A100,但受制于贸易限制,中国企业只能使用原有的A100芯片存货或降低标准选用级别较低的芯片。此外,由于技术迭代速度太快,国内前几年建设的一些算力中心无法顺利承接住以AI语言大模型为代表的算力服务,因此还面临智能算力分散的问题。
“如果各家蜂拥去做大模型,假设每家需要一万片A100,但激烈的内部竞争导致最终没有任何一家拿到一万片A100。如此恶性竞争,倒不如先通过100片A100把垂直模型做好,然后再加到1000片跑通toB或者toC的模式并产生出价值,最终由价值最高的通过市场的称重机集中算力资源加到一万片。”
北京衔远科技创始人周伯文在跟经纬创投的相关对话中提出,一方面我们需要有自己的大模型,但另一方面可能要先从垂直领域开始。
“我的观点是,先通过垂直领域的模型,去学会大模型是怎样工作的,在场景上怎么跟大模型互动,获取更多数据,形成垂直领域的数据飞轮,再去看商业模式该如何展开;等到把垂直领域做好之后,才是去思考大模型该怎么做的时候。”
也可以选择接入大语言模型
3 月 16 日晚,微软宣布将人工智能大语言模型技术引入Office 应用程序,推出 AI 助手——Microsoft 365 Copilot。该 AI 助手由OpenAI的 GPT-4技术驱动,用户可以通过Copilot实现在Word中生成文稿、为PPT增加图片和动画效果、在Excel里分析用户输入的数据并将结果生成可视化图表、帮助Outlook 进行邮件管理和智能生成回复等功能,这将极大提高用户的办公效率。
AI市场爆发性的需求增长,将释放出前所未有的、指数级的商业价值。李彦宏在文心一言发布会上预测,大语言模型将带来三大产业机会:第一类是新型云计算公司,其主流商业模式从IaaS变为MaaS;第二类是行业模型精调公司,其可以基于对行业的洞察,调用通用大模型能力,为行业客户提供解决方案;第三类是基于大模型底座进行应用开发的公司,即应用服务提供商。
李彦宏断言,基于通用大语言模型抢先开发重要的应用服务,这可能才是真正的机会。目前,基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景,已经涌现出很多创业明星公司,可能就是未来的新巨头。
其中在虚拟数字人方向,AI四小龙之一的云从科技回应财经网科技,在内容创作上,公司正在与第三方进行合作,借助公司在大数据、NLP和知识计算等方面的能力,对海量的演讲视频内容进行提炼和再创作,以低成本和高效率的方式满足客户个性化的定制需求。
此外,在虚拟互动方面,该公司正打造AI驱动的虚拟数字人,构建自身虚拟数字人方向的核心技术和产品,从而把握住虚拟直播、虚拟客服、动画游戏等新场景带来的商业机会。
据悉,无论是ChatGPT-4还是文心一言,其均存在答非所问、提供事实不准确等问题。如何在保证提供的内容准确的前提下,哪一个行业能更快接入并使用AI语言大模型到自家产品中?
赵东岩表示,搜索引擎以及使用文本生成较多的行业,如媒体、办公领域、翻译、文案编写等可能会率先应用。因为AI语言大模型在涉及可解释性、领域知识融合等方面还存在明显缺陷等问题,因此客服、法律、教育、金融等领域暂时不会大规模使用。
(文章为作者独立观点,不代表艾瑞网立场)