就在昨晚,AIGC 经历了无比疯狂的一夜。
英伟达、微软、Google、Adobe 等科技巨头在相差无几的时间里,都推出了各自的创新 AI 服务,你追我赶、振臂高呼般的向时代传达一个信号 ——AIGC 时代降临,AI 未来已来。
微软联合创始人比尔・盖茨也在自己的博客 GatesNotes 上写道,自 1980 年他第一次看到现代图形用户界面(GUI)以来,OpenAI 的 GPT AI 模型是技术上最具革命性的进步,这是他 67 年的人生中第二次被科技真正震撼到。“我很幸运参与了个人电脑革命和互联网革命。我对这一刻同样兴奋。”
在这个大 AI 时代,人类即将拥抱新一轮生产力革命,大部分人的工作方式将被彻底颠覆。而在这轮全球科技巨头的 AI 博弈中,我们也会看到鲜花、掌声、风险、机遇、责任交织在一起,如昨夜一般,构成一幅幅让人心潮澎湃的兴奋画面。
未来 AI 将会怎样改变我们的生活?微软副总裁 Jared Spataro 曾放下的一句话:一百年后,我们将会回顾这一刻,并说,“那是真正的数字时代的开始。”
刚刚结束的英伟达 GTC 2023 大会上,英伟达 CEO 黄仁勋把一个概念反复说了 3 遍 ——“AI 的‘iPhone 时刻’已经到来”。
黄仁勋将 OpenAI 的 ChatGPT 称为人工智能的“iPhone 时刻”。背后的含义是,就像 iPhone 开创智能手机界面交互模式,由此孕育了移动互联网。而 ChatGPT、Stable Diffusion 等 AI 超级应用的出现,标志着加速计算和 AI 技术的成熟已迈入成熟,AI 正推动一场新的产业革命。
如果不想被人颠覆,就要先颠覆别人。
昨夜,英伟达推出了专为 ChatGPT 设计的推理 GPU(图形处理器)。除此之外,还发布了 AI 超级计算服务 DGX Cloud、突破性的光刻计算库 cuLitho、加速企业创建大模型和生成式 AI 的云服务 NVIDIA AI Foundations 等,以及与 Quantum Machines 合作推出了全球首个 GPU 加速量子计算系统。
其中最主要的是 H100 NVL,这是一款专门针对算力需求巨大的 ChatGPT 而设计的显卡。它可以将英伟达的两个 H100 GPU 拼接在一起,以部署像 ChatGPT 这样的大型语言模型(LLM)。
“当前唯一可以实际处理 ChatGPT 的 GPU 是英伟达 HGX A100。与前者相比,现在一台搭载四对 H100 和双 NVLINK 的标准服务器速度能快 10 倍,可以将大语言模型的处理成本降低一个数量级。”黄仁勋说。
据黄仁勋透露,H100 NVL 预计将在今年下半年上市。他表示,新的 AI 技术和迅速蔓延的应用正在改变科学和各行各业,并为成千上万的新公司开辟新的疆域。
面对 Open AI 和微软的步步紧逼,谷歌绝对不会坐以待毙。
在大家被 GPT-4 的聪明程度所惊艳震撼后,被 Midjourney V5 细节拉满效果逼真所感到不可思议后,Google 终于宣布正式开放 Bard 的访问。
昨天夜里,谷歌宣布正式开放旗下 ChatGPT 竞争对手 Bard 的公测,首先将面向美国和英国地区启动。目前这两个国家的用户都可以在 bard.google.com 上进行排队等候,随着测试的推进 Bard 也会逐步在其他地区上线。
根据 Google 的最新演示,相比 ChatGPT,Bard 更像是一个专注于工作学习的随身助理。
此次 Bard 也为用户提供了一个单独的聊天界面,用户可以在文本框中进行提问和搜索,比如让 Bard 帮你写一个计划、列一个食谱、帮你搜索一个冷知识等。
在定位上,谷歌强调 Bard 并不是其搜索引擎的替代品,而是“搜索的补充”,Bard 自称为“你具有创造力的得力协作者(Collaborator)”,你可以在它的协助下,激发想法、拓展知识,可以让 Bard 用简单的语言解释量子物理学,或者让它提供头脑风暴。
但 Bard 有个更具“求生欲”和“工具性”的功能,就是一次性可以生成多种版本内容。当用户提出一个问题之后,Bard 能直接帮用户生成 3 个不同版本的答案,只需要选择 "查看其他草稿",就可以在这些草稿中切换,并根据喜好进行选择。
不过,作为 Bard 的第一个版本,它暂时还不支持更多语言(比如中文),Google 会持续更新写代码、识别 / 生成图片以及多语言支持。
当科技巨头从文字生成卷到图片生成后,著名设计创意公司 Adobe 也不甘就此被颠覆,
在这个疯狂的夜晚,Adobe 也推出了自己的创意生成式 AI 模型集:Adobe Firefly。
FireFly 专注于图像生成和文字效果优化,目前只提供线上版本。Adobe 表示,该工具将在不久后与创作工具融合,例如 Photoshop、Adobe Illustrator 等。
FireFly 目前提供两种模式,一种是利用文字生成图像的功能,另一种是创作创意文字,这两个工具对设计师都十分友好。
它可以仅靠输入相关的文字信息就可完成图像生成、模型构建、图像编辑以及图形变体等各种任务。例如,你可以从一个特定的图像开始并重做 — 例如,一个田园般的夏季农场场景再生为一个下雪的冬季。
你还可以使用 FireFly 创建任何创意文字,比如创建看起来毛茸茸、鳞片状或其他任何想要的效果的字母。
目前 Firefly 已正式对公众开放申请,之后还将有图形变体等新功能,可以说 Firefly 的加入将会对影像后期的工作流程产生变革。
也在这两天,一家名为 Runway 的人工智能创业公司宣布了一款新的文本生成视频(Text-to-video)AI 模型,名为 Gen-2,文本生成视频也就是用户可以输入一个描述,然后系统自动生成任何风格的对应视频。
体验过 Runway Gen 2 的用户,大多给出的评价都是“惊艳”!
人工智能的神奇力量这次涌入了视频生成领域。不用摄影、不用后期,只要往 Runway 中输入一段文字,它便能生成一段效果不俗的短片。
Runway 公司提供了一个基于网络的视频编辑器,专注于人工智能工具,如背景移除和姿态检测。该公司参与开发了开源文本生成图像模型 Stable Diffusion,并在二月份发布了第一个人工智能视频编辑模型 Gen-1。
Gen-1 其实已经有了文本转视频的能力,但是整体效果还是比较粗糙。时隔半年,Runway Gen 2 来了,比起 Gen-1 画面之间联结更顺畅,画质更高清,甚至可以产生效果还算精美作品的片段。
文本生成视频技术令人兴奋,也必将带来新的创造性机会,或许未来有一天,我们真的能够实现一键生成爆款小视频,人人有机会成为 KOL。
OpenAI 及其生成式人工智能 ChatGPT 发起的这场挑战,正在打破并重塑各行各业的基础逻辑。
在这一夜里,我们见证了 AI 领域从服务层到应用层的几个大突破。这些科技巨头扎堆推出的创新性产品正在证明,AI 领域已经迈进了高速发展的阶段,技术红利快速释放,研发成果不断涌现,应用场景持续拓展,我们的生活正在被 AI 力量一点点的改变。
站在新一轮生产力革命的起点,科技进步之快,让人瞠目结舌。
正如比尔・盖茨周二写道:“新技术可以帮助世界各地的人们改善生活。”他也表示,“与此同时,世界需要建立道路规则,这样人工智能的任何缺点都会远远被它的好处超过,这样每个人都能享受这些好处,无论他们住在哪里,无论他们有多少钱。人工智能时代充满了机遇和责任。”
未来已来,拥抱变化,创新突破,不断增强自身实力,方能跟上时代发展的洪流而不落伍。