“几只巨大的毛茸茸的猛犸象正踏着白雪皑皑的草地走来,它们长长的毛茸茸的皮毛在风中轻轻飘动,远处覆盖着积雪的树木和雄伟的雪山,午后的阳光下有缕缕云彩,太阳高挂在天空中。”
只需输入文字,便可生成一段长达60秒的高清视频。龙年伊始,OpenAI一款王炸级的文生视频大模型再次让世界感受到了人工智能的强大。就连马斯克也感叹:“人类认赌服输。”
OpenAI推新款大模型Sora
可根据文本生成60秒视频
16日凌晨,OpenAI在其官网发布文生视频模型Sora。
该模型可以生成长达一分钟的视频,生成的画面可以很好的展现场景中的光影关系、各个物体间的物理遮挡、碰撞关系,并且镜头丝滑可变。
OpenAI表示Sora能够生成复杂的场景,不仅包括多个角色,还有特定的动作类型,以及对对象和背景的准确细节描绘。
除了能够仅从文本指令生成视频外,该模型还能够利用现有的静止图像从中生成视频,精确地将图像内容动画化,也可以利用现有视频进行扩展或填充缺失的帧。
简单概括下来,Sora功能包括“文生视频、图生视频、扩展原视频”,长度最高可达60秒,视频更高清,细节更逼真,表现力更丰富。
除了上述的猛犸象外,OpenAI还公布了多段演示视频,例如
“一位时尚女性走在充满温暖霓虹灯和动画城市标牌的东京街道上。她穿着黑色皮夹克、红色长裙和黑色靴子,拎着黑色钱包。她戴着太阳镜,涂着红色口红。她走路自信又随意。街道潮湿且反光,在彩色灯光的照射下形成镜面效果。许多行人走来走去”。
该视频长达60秒,近乎百分百的还原了文字内容,人物、背景、光影效果的精细程度以假乱真。视频后半段,就连女性面部的毛孔和瑕疵也清晰可见,Sora似乎在以这种方式诉说着自己的强大。
更多案例:
中国龙年舞龙的视频
两艘海盗船在一杯咖啡中航行时相互争斗
赛博朋克背景下机器人的生活故事
然而作为一款初代文生视频大模型,Sora目前也存在诸多问题,OpenAI承认该模型可能会混淆提示的空间细节,例如混淆左右,并且难以精确描述随着时间推移发生的事件,例如遵循特定的相机轨迹。
据界面新闻援引外媒消息,OpenAI据悉已经完成了一笔交易,这家人工智能公司的估值达到了800亿美元,在不到10个月的时间里,其估值增长了近两倍。
周鸿祎称差距还在加大
马斯克说人类愿赌服输
Sora的横空出世引发了全球的关注,网民纷纷惊叹于人工智能的高速发展,一众大V也发表观点。
360创始人对Sora给予了极高的评价,他认为,Sora的诞生意味着AGI(通用人工智能)实现可能从10年缩短至一两年。
周鸿祎认为,科技竞争最终比拼的是让人才密度和深厚积累,“很多人说Sora的效果吊打Pika和Runway。这很正常,和创业者团队比,OpenAl这种有核心技术的公司实力还是非常强劲的。有人认为有了AI以后创业公司只需要做个体户就行,实际今天再次证明这种想法是非常可笑的。”
他还提到,尽管国内大模型发展水平表面看已经接近GPT-3.5,但实际上跟4.0比还有一年半的差距。OpenAl手里应该还有一些秘密武器,无论是GPT-5,还是机器自我学习自动产生内容,“奥特曼(OpenAI CEO)是个营销大师,知道怎样掌握节奏,他们手里的武器并没有全拿出来。这样看来中国跟美国的AI差距可能还在加大。”
胡锡进也表达了自己对Sora的看法。他表示,这的确是爆炸性进展。到今天中午,在贾玲现实主义电影《热辣滚烫》的引领下,中国今年春节档的票房突破70亿。但是Sora在点亮AI影像制作未来的同时,也给全球现实主义电影的前途抹上了阴影。“让老胡接着看春节档电影都有些心神不宁了。”
Sora发布后数小时,马斯克在社交媒体上回复了“gg humans”,gg为Good Games缩写,代指“打得好,我认输” 。之后马斯克还称,通过AI增强的人类将在未来几年创造出最好的作品。
Sora对未来影响几何?
哪些人会因此失业?
Sora的诞生意味着,在文字、图片之后,AI的技术已经突破到了视频领域。虽然在此之前,Runway Gen 2、Pika等AI视频工具已经发布过类似的模型,但相较之下,别家的大模型还在致力于突破几秒内的连贯性,OpenAI已经可以实现60秒的超精细视频制作,这一技术可以说是史诗级别的突破。
那么这史诗级的技术变革会给人类带来哪些影响?
中国企业资本联盟副理事长柏文喜对蓝鲸记者表示,Sora作为一种强大的视频生成工具,可以极大地降低视频制作的门槛和成本,使得更多人能够轻松创建高质量的视频内容。这将对影视、广告、游戏、新闻、教育、VRAR等诸多行业产生深远的影响,具有广泛的应用前景。
例如在影视行业,人人都是导演的时代即将来临,Sora可以快速生成逼真的场景和特效,帮助制作人员更好地实现创意,提高制作效率。在广告行业,Sora可以根据品牌需求和营销目标,快速生成高质量的广告。
内容创作的方式变革后,文学创作领域也将迎来复兴,小说可以直接生成动漫、电视剧。视频内容集中爆发,自媒体行业也将迎来重新洗牌。随着技术的不断深挖,未来Sora会将在更多领域得到推广应用。
不可否认,技术的变革是把双刃剑,在关注应用前景的同时也有不少人担忧会被AI抢了饭碗。那么视频模型Sora的出现会对那些岗位产生冲击?哪些人会因此失业?
从上述专家的分析来看,目前最容易受到影响的或许是影视行业的从业者。
例如视频剪辑师、后期制作这类岗位,视频模型Sora能够自动或半自动地生成视频,这可能会导致传统的视频制作和编辑职位的需求下降。后期制作包括剪辑、特效、音效等环节,这些工作也可以通过AI技术进行自动化或半自动化处理。
再比如新闻主持人这一岗位,Sora模型可以根据输入的文本自动生成视频新闻报道,一些简单的新闻报道任务可能会被Sora模型所取代。
此外,游戏动画师、广告创意和设计岗位、内容创作者等岗位都有可能受到大模型的冲击。
一觉醒来,AI行业变了天,Sora 的出现犹如一记重磅炸弹,让世界看到了人工智能的无限可能。2024年第一块坚实的里程碑落下了,带给人类的依旧是希望大于绝望。