“别急着投降,AI三体人还没来呢”
2月16日,OpenAI发布了视频生成AI产品Sora,这款产品可以生成最高60秒的连续视频,超越了目前面世的其它视频生成类的AI产品。根据OpenAI公布的视频等资料可以看出,Sora生成的视频连贯自然,背景细节真实度高,还能包含指定的情节。
图:Sora生成
Sora一经发布,把Runway、Pika、Stable Video等同AIGC视频类产品实现了技术和呈现上的碾压,科技圈的人一时间赞不绝口,动漫行业从业者看到后也不禁哀叹:留给传统动漫的时间不多了。
但事实真的如此吗?
Sora领先在哪?“生成长达60秒视频”这一项特点仅仅是Sora的一个小优势,在视频内容的真实性、稳定性、一致性等方面,Sora都实现了突破。和其它AIGC视频工具相比,其它产品的视频制作逻辑还是由单图进行动态化演变,而Sora已经做到了动态运镜、镜头切换、稳定追焦等更影视化的效果。
从输入相同的描述词生成的具体效果来看,Pika、Runway、Stable Video和Sora的区别非常明显。在这段同为“美丽的东京雪景熙熙攘攘。镜头穿过熙熙攘攘的城市街道,跟随几位正在享受美丽雪景和在附近摊位购物的人们。绚丽的樱花花瓣与雪花一起随风飞舞。”描述下,Sora明显是视觉上给人观感最丰富的那个,Pika和Runway的生成还是基于固定机位,静中有动的思路,仅用部分元素的动态证明生成的是视频;Stable Video的镜头是在运动的,但更像是vlog的慢放片段。
这样的突破得益于OpenAI为了实现“模仿人类思维、决策,有自我意识,自主行动”目标(即业内热炒的AGI)而着手组建的“世界模型”,即希望AI从人类与自然中理解后模拟真实世界的因果并做出推断。因此,Sora并不是OpenAI的一项独立的工具型项目,而是利用了包括自家GPT、Dall·E(文生图工具)在内产品进行衍生的又一款工具。当其它公司的AI相关视频生成产品还在以“连贯图像”的思路去做生成时,Sora已经完成了“从文字直接生成视频”的进步。
这就像别人还在研究如何做好动态漫画时,有人已经开始直接交出动画作品了。
夸张的是,根据OpenAI发布的技术文档,Sora在视频生成上并没有借助类似现有的3D物理引擎就实现了对三维世界的理解。这款产品先将大量的视频素材进行“视觉块”(visual patch)化,交由AI进行“领悟”。在AI能够理解其中的部分含义,并足以生成视频模型后。Sora就能根据用户提供的提示词进行理解,找寻合适的视觉块进行组合和生成。这样一来,Sora在生成过程中就减少了由静转动的过程,也不需要通过物理引擎的干预,直接进行视频生成。
所以Sora的横空出世,还是让AI视频生成领域产生了一种“GPT时代”到来的冲击感。
AIGC在ACGN领域的应用当然,当AI领域在追逐AGI不断出现令人耳目一新的产品时,文创领域也发生了一些变化。抛开一些关于AI工具对于创作者的冲击不谈,在小说、漫画和动画领域,创作者们已经开始尝试使用相关工具提高创作效率,以及通过AI寻找一些创意思路。在不少ACGN创作者看来,AI的出现可以让他们更加专注于对故事情节、角色细节的打磨和挖掘,而将过去大量消耗时间的制作过程交给AI完成。
小说:转制视频进行买量虽然去年阅文集团公布了所谓的创作用大模型“阅文妙笔”,但从其迟迟没有公测就能看出,通过AI撰写小说的技术依旧不够成熟。但是,小说在市场推广上实实在在地吃到了AIGC工具的红利。将小说部分情节转化为动态漫的过程变得高效,相关创作的灵活性和个性化也得到了充分的展现。
据了解,目前部分平台的小说推广团队已经完成了对热门小说进行买量推广视频生产的工业化搭建。先是利用GPT、文心一言等语言类大模型对小说剧情进行提炼,根据小说中的亮点内容创造详细、生动的推广用短视频脚本和文生图描述词。
根据文生图的描述词,利用AI文生图工具生成视频中可用的大量剧情图片,并通过TTS等语音技术将视频脚本读出。最后将视频脚本、剧情图合成,直接投放到视频平台。由于很多网络小说原作的剧情并不亚于视频平台上的短剧,因此这样的买量内容也能吸引大量流量,进而转化成付费读者。
漫画:上色和创意辅助由于漫画存在着一定的风格化和创意壁垒,目前市面上还没有一款完全能从故事生成漫画的产品面世。但上色技术已经趋于成熟,国内不少工业漫画已经使用这项技术,用于替代原本的上色临时工。去年靠谱二次元曾提到过专门用于上色的工具Style2Paints,以及越发成熟的ControlNet都可以让漫画/插画行业的不少创作者“偷懒”。
来源:UP主 插画师小光
另外,不少漫画作者还尝试将自己的草图扔进AI图片创作工具中进行色彩搭配和二创,通过AI工具帮助自己琢磨出更好的构图和上色选择,或是将人工上色和AI上色的作品进行对比,保持艺术风格的一致性。随着这些AI辅助技术的进步,漫画的制作过程开始加速,同时为漫画家提供了更广泛的创意空间,使他们能够探索新的故事讲述方法和视觉表现技巧,从而吸引更广泛的读者群体。
动画:人设、3D模型人物生成在动画领域,AIGC技术给人的直观感受用一句话可以概括:雷声大,雨点小。虽然有视频平台和内容公司已经陆续宣布将会上线由AI完成的动画番剧或院线电影,但从目前公布的进度看,仍然处于非常早期的阶段。
事实上,大量AIGC工具早已悄悄进入了动画工业化领域。在3D模型批量生成方面,一些3D动画公司早已尝试为动画制作引擎开发了相关插件,以便于在大场景群像情节中插入大量角色,甚至有公司还为非主要角色的批量互动开发了自动互动的功能,方便动画师快速完成一部分大场景的动作戏。
另外,市场上也出现了一部分基于AI生成3D模型的厂商,发布了Tripo等产品,通过此类产品可以快速生成包含纹理的3D模型,快速导入原有的动画管线中进行二次编辑。这样的产品降低了动画师们在人物和道具建模时的制作压力,提高了动画制作的效率。
此外,还有一部分动画公司开始围绕文生图工具进行增效,例如通过Stable Diffusion等工具配合特定的大模型或Lora模型生成人设三视图,用于角色的设计。另外还有动画公司通过AI生图工具进行动画场景创作,在提高效率的同时,还能产生更多的视觉风格,为观众带来不同的体验。
这些技术的应用,说明AIGC不仅可以为内容创作者提供强大的助力,还能推动着整个数字内容产业的进步,开辟了新的创意可能性,同时创造一部分新的商业机遇。而Sora的到来,或将让AI在ACGN领域的应用出现更多的想象空间和可能。
Sora能提升ACG内容产能吗?不过,市面上还没有一套公开且完全能适配漫画或是动画工业的产品。况且,在AI加速实现AGI的背景下,国外的文娱内容企业的工会和创作者们对AIGC一直保持着警惕和抵制,而国内动漫相关企业受制于人才能力,无法在AI上投入自研精力。
如今,距离AI的GPT奇点时代虽然已经过去一年多,但对于强依赖于创意和经验,且连贯性需求较强的漫画和动画行业,AI的出现还不足以实现劣币驱逐良币,但依旧加速了一部分原有劣币的退场。
对于动画行业而言,目前看来,创作者使用Sora接管部分创作流程依旧很有难度。首先,在超过60秒的情况下,Sora保持风格一致的能力还有待观察。根据OpenAI发布的视频就能发现,即便利用某些参数文字固定了需求,但目前Sora仍然不能保持完全和谐的风格。此外,Sora虽然生成分辨率可以达到1080P,但现在的版本对于视效的理解还非常欠缺,还会概率性生成和现实世界里的逻辑相反的动作,这些硬伤都决定了它还有很大进步的空间。
图:Sora生成
但是漫画行业或许能通过Sora或类似产品在短视频市场获得一些突破,「动态漫画」或许将迎来一个AI化的新阶段,根据Sora自述中利用“世界模型”和最终效果呈现来看,已经可以通过静态的图片产出具备空间感、立体感和镜头感的内容。这样的突破对漫画行业是有一定帮助的,一些连贯的漫画内容甚至可以通过这一功能,实现动态漫自由,更方便抢占当下短视频驱动的用户市场。
当然,无论是去年的Midjourney+Stable Diffusion热,还是ChatGPT等可泛用AI产品的火爆,都没有让追求降本增效而沉寂的漫画和动画行业做到颠覆性的产能突破。即便身披OpenAI光环的Sora横空出世,也并不能改变太多。坦白来讲,能让国内的漫画、动画行业通过AI实现内容突破,其实主动权并不在这些创作者手里,而是Sora等AI产品对二次元世界乃至现实世界的理解能力。
图:Sora生成
当有一天AI工具能做到与导演、编剧对ACG内容的了解程度,或许动画、漫画行业才能迎来自己的奇点时间。从近两年AIGC类产品以及OpenAI相关产品的发布速度来看,这一天或许并不遥远。对动画、漫画从业者而言,现在毋须过度担心AI工具造成人才过剩的情况,只要能随时跟进此类产品的进度并适当掌握其操作方法,那么就不太会被淘汰。
至少从目前来看,AIGC产品依然只是一项辅助工具,操作者对内容本身的了解和对工具的掌握程度才能最终决定出产内容的质量。而在此之前,无论去做出更好的内容证明人类创作者价值,还是拥抱AI工具成为首批熟练使用AIGC的人才,一切都来得及。
本文作者:Soda,由 < 靠谱编辑部 > 编辑