3 月 15 日,AI 绘图工具 Midjourney 发布了第五代 V5 模型,由其生成的一张“中国情侣”图片因效果酷似真人火爆“出圈”,其质量水平被一些 AI 艺术爱好者称为“非常完美”。
不到一个月,互联网上铺天盖地都是网友们用 Midjourney 生成的各类图像,题材涵盖人物肖像、商业广告、城市街景,甚至特朗普、Obama 等名人流落街头的落魄形象。还记得去年 8 月获奖的《太空歌剧院》吗?那幅画也是用 Midjourney 创作的。而此时,距离 2022 年 3 月 Midjourney 首次面世仅一年时间。
▲ 由 Midjourney 生成的“中国情侣”照片令人惊讶的不是 AI 的出现,而是 AI 技术日趋逼近真实摄影效果的快速迭代。在其“创造者们”看来,它迭代后的水平也同样让人兴奋。“Midjourney V5 目前对我来说感觉像是在视力不好太久之后终于戴上了眼镜,”使用 Midjourney 创作的平面设计师 Julie Wieland 说,“突然间你看到了 4K 的一切,感觉不可思议但又令人惊叹。”
这股旋风也吹到了摄影行业,已有大量专业人士开始试水 AI 创作。在微信公众号、小红书、B站等社交媒体平台,一些摄影师发布图文或视频记录了 Midjourney V5 的使用结果,一时也引发诸多“AI 技术会不会替代摄影师”的相关讨论。
AI 技术的生成效果到底如何?
华东师范大学摄影教师吴晓隆试用过 Midjourney V4、V5 两个版本,觉得“V5 的效果确实更逼真了”。
▲ 吴晓隆通过 Midjourney V4 生成的图像“上面这张图片是当时 V4 生成的,使用了黑人、复古、室内、听音乐、灯光等关键词,除了手指是 6 根,其它都很完美了。V4 生成出来的人像基本是一个人的大头照,比较单一,到 V5 就非常多样化了,各种景别都有。”
在吴晓隆的另一项测试中,Midjourney V5 显示出了惊人的模仿能力。只要在 Midjourney 中输入一串简单的指令:photo by xxx,其中 xxx 是一些著名摄影家的名字,AI 就能准确识别并呈现那位摄影师的创作风格和画面质感,并在不到 1 分钟内渲染 4 张可供选择的图片。
▲ 吴晓隆通过 Midjourney V5 生成的图像对于 Midjourney V5 的表现,吴晓隆给出四个字“又惊又喜”:“惊讶的是我简单输入几个字,它就能出来完整一张图,喜的是它跟我想的虽然不完全一样,但是也有美感,而且比我想的更丰富。”
小红书博主龙二圈因对 AI 技术感兴趣,也率先尝试用 Midjourney V5 生成了《北京胡同十岁小孩》和《粉色娃娃的刻板印象》两组 AI 图片,她认为 Midjourney 的表现结果“甚至可以与真实拍摄的摄影作品打平分”。
“V5 版本虽然在手和文字的表现上稍微欠佳,对人物刻画的精细程度却让人意想不到。在使用之前我想象的是,它能差不多把人的面貌描绘出来,就达到预期了;没想到的是,它比预期之中能更精细准确地刻画人的面部表情,与背景之间的关系也比较和谐融洽。”
Midjourney V5 呈现出了高超的绘画技艺,却仍然无法实现完美的交互。摄影师 Z 试用后的体验是 —— 关键词对 AI 生成图片的结果影响很大。
“英文能力较强、了解摄影专业术语的人,使用 Midjourney 这种 AI 软件得到的结果会更理想。如了解光线、场景、比例、色温等摄影基础词汇,并知晓艺术流派,深谙摄影美学的专业人士,使用 AI 软件会获得比较好的效果。”
对此,摄影师 Z 还进一步举例:假设要创作一幅创意图片,如果给 AI 的指令是“周受资舌战群儒”这一类新闻标题式的描述,可能无法直接生成理想结果,AI 必须要得到更加准确的描述性指令。
除了给 AI“喂”关键词需要极强的技巧之外,在部分摄影师的体验中,也会发现 AI 存在“刻板印象”的蛛丝马迹。
“我让 AI 生成五个女摄影师举着相机给一个穿粉色 T 恤的男性拍照,结果 AI 生成的是男性举着照相机,女性穿着粉色 T 恤,无论如何修改关键词,都得不到想要的结果。”龙二圈就曾遭遇这样的“无语事件”,“让 AI 生成很多中国小孩,这些小孩常常看起来不那么‘阳光灿烂’,衣着也常常是破旧的状态,有种愁苦味,直到我不得不增加关键词‘一个有钱的中国小孩’。”
在“刻板印象”的背后,是数据库陈旧、照片素材有主观意味?还是 AI 的逻辑中有刻板印象?摄影师们无法给出答案。
02、AI 不会成为这样的 0.01%
尽管 Midjourney V5 的交互目前还并不趋于完美,但其现象已带动了大规模关于“AI 替代摄影师”的争论。不乏网友在生成作品下评论“摄影已经不存在了”“AI 将取代摄影师”……
对于 AI 技术是否会取代摄影,可能得分别讨论,业界更为普遍的观点是“在 AI 技术之下商业摄影最危险”。
在龙二圈看来,一部分套路千篇一律的商业摄影会被替代。“可以想象,由一个熟练的‘AI 训练师’使用 AI 来生成图像,成本更低、时间更短、也更符合客户想要一遍又一遍改到满意的需求。”
▲ 龙二圈通过 Midjourney V5 生成的图像而吴晓隆则进一步提出,商业摄影在 AI 时代下会顺应“刚需保持、低端淘汰、高端求变”的规律。“刚需就是证件照,婚纱照这种;低端的一些没有创意的摄影都会被 AI 淘汰;高端的比如拍明星广告,也需要求变,否则到时候只要人脸数据授权,也可以 AI 生成出来。”
新闻摄影、纪实摄影与艺术摄影,在 AI 技术面前则更“乐观”。在摄影师眼中,AI 技术更等同于算力,或者说只是一个可能的辅助工具,而摄影,还是以人为本。“人们会更需要好的新闻照片,这方面的需求会因为 AI 而加大,看多了假的就想看最真实的。”吴晓隆分析。
摄影师 Z 也持类似观点,认为 AI 无法实现新闻及时性、人的创作性和灵性。“机器最终只是模仿人类,但不可能替代人类的创作性。当一位摄影师带着心情和性格去拍摄记录,他所展现的不仅有画面,还有人类独有的怜悯、关怀与爱。就像一位谷歌工程师所说,人的灵性永远不可能被替代。”
与此同时,AI 似乎还无法达到让摄影专业人士完全认可的水平,创作虽然惊艳,但业内人员依然能看出不是“真的”。吴晓隆认为“AI 还是差了一口气,只有表面相似没有内核,经不起深究。”
尤其是在艺术摄影方面,大家只希望 AI 作为辅助存在。“艺术摄影需要创作者拥有对世界的感受和对庸常的叛逆,但 AI 没有情绪,它生成的图像更多是基于机器学习和概率,而不是对世界的感受。在艺术摄影部分,AI 更适合帮助艺术家收集信息。”龙二圈说道。
摄影师 Z 给出了类似的观点,他认为 AI 或许可以给当代艺术带来一些灵感,“机器看过的肯定比人看过的多,那么机器也许可以给人一些思考的源泉。未来的当代艺术与商业创作中,人们其实可以用 AI 为自己画出想象出的场景,以作为实拍前的验证。”
总体而言,似乎大家并不担心 AI 替代人类。诚如摄影师 Z 所说,像塔可夫斯基这样的艺术大师,一两个世纪才会诞生一位,他们极大地拓展着艺术边界,AI 不会成为这样的 0.01%,只能是给人们带来一些启示。
03、有图有真相的时代过去了
随着“高智商”AI 掀起新一轮的 AI 革新,人们似乎在各领域对 AI 都产生了极高的期待。英伟达创始人 CEO 黄仁勋将这一轮技术革新称为“AI 的 iPhone 时刻”。他认为,AI 可以帮助人类打开“脑洞”,激发人类的创造力,提升生产效率。
在摄影领域,的确也诞生了众多积极看待 AI 的探讨。作为大学老师,吴晓隆更倾向于积极引导学生,“AI 不会抢走他们的工作,相反会创造更多可能,应该主动迎接变革”。摄影师们近期也在不停思索如何将 AI 技术应用在专业中。
但即便摄影业界积极地看待 AI 带来的创造性变革,他们也同样担心相关技术演变带来的另一重“风险”。如一位网友在评论中写道,“‘眼见为实’这四个字从此距离人类越来越远”,当 AI 生成的摄影作品日益逼真,人们又该怎样分辨何为真实。
▲ 2022 年 8 月重庆山火,社交媒体上出现大量 AI 生成的火灾配图对此,未来的摄影行业似乎更需要验证 AI 的工具出现。“我觉得一定是需要某些规则来识别以避免 AI 生成以假乱真,也许可以开发一个辨别是否是真实照片的 App,比如就叫做‘照片真实辨别器’,判断照片是否由 AI 生成”,龙二圈说道。
“有图就有真相的时代过去了,我们确实需要面对这些问题。”摄影师 Z 亦认为技术变革的脚步无法阻挡,“潘多拉的魔盒一旦打开,人们无法停止探索的脚步。我们唯一能够思索的是,怎样创造对抗的工具去遏制 AI 生成图片所产生的法律与道德风险,以及怎样避免掌握 AI 算力的人和组织,利用 AI 的通道去影响公众思考,通过掌控技术去掌握话语权。”
如今,AI 技术对摄影与其相关产业影响会有多深,依然无法全盘判断。
但可预见的是,身处 AI 洪流中的各行各业,都要开始思考“如何与人工智能共处”这个问题了。
本文来自微信公众号:慢放 (ID:manfangsd)