1 月 30 日消息,从推出至今 2 个月期间,AI 聊天机器人 ChatGPT 给行业带来的话题不断。
ChatGPT 聊天对答如流,能够撰写流畅的文章,生成有效的计算机代码,解决人文艺术类学科问题,翻译文本,甚至它的回答通过了知名大学的法学研究生考试、商业管理考试……
免费又好用的 ChatGPT 成功火出 AI 圈,进入普通大众视野。
去年 11 月 30 日,人工智能公司 OpenAI 发布聊天机器人 ChatGPT。和 OpenAI 此前推出的产品不同,这次 ChatGPT 采取了开源开放、免费用的模式。
免费又好用, ChatGPT 不到一周就聚集了超过 100 万用户,其圈粉速度之快震撼整个 AI 产业界。
ChatGPT 的大火,让 OpenAI 吸金能力飙升。
2019 年微软曾向 OpenAI 投资 10 亿美元,以换取 OpenAI 技术的独家许可。现在,OpenAI 的估值飙涨至 290 亿美元。
ChatGPT 在全球爆红还震动了 AI 界的大佬谷歌。
ChatGPT 推出不足 1 个月后,谷歌 CEO Sundar Pichai 在公司内部发布了“红色警报” (Code Red),并称围绕 ChatGPT,全面调整 2023 年谷歌在 AI 领域的工作。
更夸张的还有 ChatGPT 的“加持”能力。
就在几天前,美国版头条公司 BuzzFeed 宣布计划利用 ChatGPT 创建者 OpenAI 来生成和个性化其部分内容并增强其体验后,其公司一直不温不火的股价 2 天涨了近 3 倍。
纷繁的信息背后,ChatGPT 所代表的 AIGC(AI generated content)技术水平到底达到了怎样的高度?
根据 OpenAI 官网的介绍,ChatGPT 基于 GPT-3.5 预训练大模型创建,采用的模型使用了“利用人类反馈强化学习(RLHF)”的训练方式,包括:人类提问机器答、机器提问人类回答,不断迭代,让模型具备对生成答案的评判能力。
相比 GPT-3 大模型,ChatGPT 的主要提升点包括:能记住之前的对话,可实现连续对话,更符合真实的人类对话情景,能承认错误、会拒绝不适当请求;新训练增加了代码理解和生成的能力,ChatGPT 具备与编程相关的基础知识。
回顾 OpenAI 的技术路线,自 2018 年开始,OpenAI 陆续发布了 Generative Pre-trained Transformer(GPT)系列预训练语言模型。
GPT-1(2018 年发布)、GPT-2(2019 年发布)、GPT-3(2020 年发布)的参数分别达到 1.17 亿、15 亿、1750 亿。此后,OpenAI 投入大量精力,通过代码训练和指令微调来增强 GPT-3。ChatGPT 被视为是基于 GPT-3 的微调版本,即 GPT-3.5 创建的。
所谓外行看热闹,内行看门道。
在 AI 技术界的大拿们看来,ChatGPT 不是什么新鲜事。谷歌、Meta、DeepMind、国内的百度等公司都有推出类似技术水平的“聊天机器人”服务。
Meta 首席科学家、图灵奖获得者 Yann LeCun 就认为,就底层技术而言,ChatGPT 并不是多么了不得的创新。虽然在公众眼中,它是革命性的,但是它就是一个设计得很好、组合得很好的产品而已。
在 Yann LeCun 看来,ChatGPT 使用的 Transformer 架构是以自监督的方式预训练的,自监督学习可以追溯到 OpenAI 出现之前,而 Transformer 是谷歌的发明,这是 GPT-3 等大型语言模型的基础。ChatGPT 使用的人类反馈强化学习(RLHF)的技术,也是由谷歌 DeepMind 实验室开创。
谈到 ChatGPT,百度技术委员会主席吴华同样认为“ChatGPT 不是一种技术的颠覆式创新”,但是,吴华表示,“它是一种交互方式的革新。”
吴华认为,ChatGPT 在展现方式上,让用户更容易去交互,能以自然语言的方式去交互,这对大家来说有一个“革新性”的认识。ChatGPT 在用户界面和交互上的创新模式,“对我们也有启发”。
事实上,对一项新技术应用而言,与使用群体的交互方式的创新,也能带来领先优势。这在软硬件产品领域一直得到验证。硬件领域,例如从按键到触控、再到语音控制,交互形式的每一步革新都催生出新的行业竞争格局。软件领域更是如此,更好的交互体验更能轻松赢得用户青睐。
现在,对国内用户而言,使用 ChatGPT 仍有很多限制门槛。
国内科技大厂埋头研发 AIGC 技术多年,借着 ChatGPT 的东风,现在是时候加大力气研究一番如何让 AIGC 这项技术能飞入寻常百姓家,让普通用户用起来。
ChatGPT 的爆火,让普通人感受到 AI 带来的便利,行业里衍生出“ChatGPT+”效应。
微软 CEO 纳德拉透露,计划将 ChatGPT(聊天机器人)、DALL-E(文生图) 等人工智能工具整合进微软旗下的产品中,包括 Bing 搜索引擎、Office 全家桶(包含 Word、PPT、Excel 等)、Azure 云服务、Teams 聊天程序等。
有不具名员工透露亚马逊云科技部门的一个小型工作组开始测试 ChatGPT 在客户支持问题方面的表现,并发现“做得非常好”,此外在为数据库工程师编写故障排除指南方面也“非常出色”。
也有用户把 ChatGPT + Stable Diffusion(AI 文生图工具) 结合使用。即先要求 ChatGPT 生成随机的艺术 prompt,然后把 prompt 作为 Stable Diffusion 的输入,生成一副艺术性很强的画作。
还有人提出“ChatGPT+WebGPT”,WebGPT 为高阶版网页爬虫,从互联网上摘取信息来回答问题,并提供相应出处。“ChatGPT+WebGPT”产生的结果信息可以实时更新,对于事实真假的判断更为准确。
针对 ChatGPT 在解答数学题方面的拉垮表现,计算机科学家、Wolfram 语言之父 Stephen Wolfram 发文表示,正在将 ChatGPT 与自己的 Wolfram | Alpha 知识引擎结合起来用,因为后者具有强大的结构化计算能力,可以实现完美互补。
这些“ChatGPT+”效应的出现,其实质也是 AI 业界喊了这么多年“AI 赋能”。
“ChatGPT+”能给现有的产品和服务带来哪些新玩法和新体验,无疑是值得期待的。ChatGPT 的成功,也给更多在探索 AIGC 商业化落地的企业提供了参考和借鉴。
尽管 ChatGPT 让 AI 技术界人士激动,但是学术界对 ChatGPT 表现出警惕。
ChatGPT 免费又好用,可以根据简单提示生成几乎任何主题的原始文本,引起了学术界对剽窃的担忧,担心 ChatGPT 会帮助学生在考试中作弊。
这种担忧也并非没有必要。
近期 Study.com 向 1000 名 18 岁以上学生发起的调查显示,48% 的学生用 ChatGPT 完成小测验,53% 的学生用 ChatGPT 写论文。年轻人对新技术的接受速度远超想象。
近期,巴黎政治学院宣布禁止使用 ChatGPT,因为 ChatGPT 可以生成连贯的文章或者论文,以防止学生欺诈和剽窃。
更早之前,全世界第二大程序员交友网站的 Stack Overflow 官方发文禁止用户用 ChatGPT 直接生成“垃圾答案”,否则封号。
百度创始人李彦宏说,AIGC 或许将颠覆现有内容生产模式,实现以十分之一的成本,以百倍千倍的生产速度去生成 AI 原创内容。
微软 CEO 纳德拉说,当前 AI 将引发一场波及全行业的“平台转移”,就像过去 15 年向移动设备和云计算平台上转移一样。
每一项新技术进入人们的生活时,总是伴随着兴奋和质疑。那么就让 ChatGPT 们 多飞一会儿!