对于在AI时代秉持内敛型战略的企业而言,「世界模型」只是遥远而美妙的幻境,更现实的三步走计划可以概括为优化已有功能、探索AI原生功能、实现用户的AI化。
作者 | 李威(北京)
2024年上半年的AI视频生成赛道,快手毫无疑问是最大的赢家。视频生成大模型可灵在六月推出之后,凭借更高的可用性和更快的功能迭代,风头很快超过了将这个赛道推到舞台中心的Sora,也让快手在这一轮的大模型竞争中找到了属于自己的位置。
可灵在市场上受到的追捧,也成功点燃了更多人对AI视频生成的热情。C端,快手和抖音上有越来越多的创作者开始采用AI视频生成技术进行创作,AI视频生成与短剧的结合更是被寄予厚望。B端,可灵在7月迎来了更多具备可用性的同仁,有智谱AI的清影、生数科技正式上线的Vidu、爱诗科技的PixVerse V2。
但是,AI视频生成赛道的火热到目前为止还没有呈现「百模大战」那样的盛况。一个很明显的差异是,此前围绕AI Agent和AI搜索热情尝试的互联网大厂,在AI视频生成领域却没有像快手一样倾注企业的全力,甚至有一部分参与「百模大战」的企业并没有发布相应的产品。
在可灵走红之后,也只看到了阿里团队推出了面向轨迹的DiT框架Tora,字节在App Store上线了即梦的移动版。前者能够看到的还仅是官网上公布的演示视频和论文内容。可以试用的demo还没有上线;后者并没有对比可灵更早上线的AI视频生成能力进行更新,更像是一项常规动作。
很明显,AI视频生成在不同企业内部有着不同的优先级,决定先后顺序的是企业有什么和想要成为什么。拥有云服务基础且业务布局更广泛的字节、阿里、腾讯会更侧重布局未来,让自己成为AI时代的基础设施提供者和获取AI服务的最大入口;专注大模型研发的创业企业最需要将AI技术能力转化为实际的业务和收入。
对于快手这种已经在移动互联网时代圈占下一片领地,拥有一定规模用户体量的企业,当务之急是要将AI技术融入到改在现有业务的进程中,为自己的领地建立一堵可防御AI技术冲击的坚固城墙,让自己在AI时代也能延续自己的领地。然后,可能才会考虑到向领域外拓展自己的AI能力。
快手在可灵的研发上拿出「大力出奇迹」的作风,力求以更快地速度拿出更具可用性的产品,一定程度上显示出了追逐AI浪潮的急迫。在可灵上线之后,快手也通过上线AI短剧《山海奇镜之劈波斩浪》、举办视频创作大赛、推出创作者孵化计划、给予流量扶持,积极地扩大AI视频生成内容的影响力和应用范围。
在快手的一系列动作中,我们看到了可灵们影响和改变短视频内容生态的决心。这是一种实用主义的聚焦型/收敛型策略。同时,在OpenAI对Sora的定义中,Sora是构建物理世界通用模拟器的一条可行之路实现AGI的又一个里程碑。这看上去又赋予AI视频生成一个发散拓展的可能性。
无论从现阶段的实际技术能力上,还是企业的具体业务布局上,「世界模型」都还只是遥远而美妙的幻境。可灵们极难借此帮助快手们完成AI时代的站位跃迁,改变视频创作可能是目前更有可能触摸到的未来。
可灵必须大力出奇迹
与快手此前给人留下的慢企业印象不同,被逐渐还原的可灵开发过程更像是一个字节式的「大力出奇迹」故事:受到Sora鼓舞,一个二十余人的小团队开始进行AI视频生成技术的研发,很快被确定为快手的战略级项目,得到了企业资源的全力倾斜,不计投入,以最快速度实现可用,然后持续优化迭代。
这个过程中,快手表现出了坚定的战略决心和执行力。快手CEO程一笑对可灵项目的表态是「一定要大做」。快手高级副总裁、主站业务与社区科学线负责人盖坤则承诺,企业的卡都给可灵项目用,企业全力支持。协作部门也纷纷给予可灵项目最积极地配合。
从3月到6月,可灵项目用了三个月时间就被推向了市场,发布一个月后就已经开放给超30万用户使用,生成超700万条短视频,获得了很好的反馈。上线之后,可灵依然保持了极快的更新频率,通过几次升级陆续增加了图生视频、视频续写功能,以及PC端的网站。
快手在可灵项目上的这种少有的急迫感,可能源于紧跟AI的战略判断与没站在大模型舞台聚光灯下的矛盾。在大模型引爆新一轮AI热炒的一年多时间里,快手虽然也跟随潮流推出了大语言模型「快意」和文生图大模型「可图」,却没能借此在激烈的大模型竞争中实现领跑。
其背后的原因是,快手对短视频业务的专注,使其并不擅长为AI Agent和AI搜索等大语言模型应用,提供足够丰富的面向未来应用场景的接口。缺乏应用前景的探索自然也无法快速建立从技术到应用的产品延伸链条。当然,快手并没有放弃,依然在尝试推出「飞船」这样的智能助手APP。
Sora的出现为快手带来了一个最有能力抓在手中的时代机遇。作为头部短视频平台,快手在算法技术的人才积累之外,还有大量标注清晰地干净视频数据,叠加上企业全力倾斜资源的BUFF,能够打出一个时间差,通过快速上线高可用性的产品,让雪球滚起来,在AI视频生成领域建立优势。
可灵在现一阶段的表现已经验证了快手这次战略卡位的有效性。不同的测评结果验证了可灵在同类产品中能够实现比较好的视频生成效果,特别是在生成视频的局部细节和画面质感上的优势。相较而言,一部分测评都认为缺少足够的高质量视频训练数据,导致智谱AI的清影生成了太多动画内容与模糊画质的视频,影响了使用体验。
内敛型的AI策略选择
通过可灵快速上线抢占先机之后,快手将先机转换为长久的赛道竞争优势,需要技术快速融入与改变视频场景。这也符合快手在2023年初确定的新AI战略的指向,即让AI技术赋能现有的业务场景,探索AI如何围绕短视频落地应用。这也意味着,快手会更倾向于利用AI技术强化现有的护城河,而不是越过河去扩张新的领地。
在2024世界人工智能大会举办期间,盖坤和快手副总裁、大模型团队负责人张迪的演讲,也体现了快手让AI服务于短视频的聚焦型战略选择。盖坤表示,快手的大模型矩阵深度服务快手的商业生态场景。张迪则认为,将用大模型技术重塑快手业务,能够提升创作者的内容生产体验和用户的内容消费体验。
在可灵上线PC端应用的同时,主打AI图像生成的可图平台也被融入进了可灵中。整合后,快手的可灵与字节的即梦一样,不再局限于AI视频生成,而成为了一个瞄准AI创意内容生成的综合平台。这是快手快影和字节剪映之间围绕视频创作工具的竞争在AI时代的延续。
在融合AI视频生成内容的动作上,快手要显得更为激进。首先,快手举办了「灵」感迸发——首届「可灵」AIx快影视频创作大赛,总奖金额度达到30万元;其次,快手公布了「可灵AIx星芒短剧」创作者孵化计划,为AI短剧创作者提供千万级流量扶持,且不限参与账号的粉丝数量。
可灵融入快手短视频生态可以帮助快手实现两个目标:一个是从内容侧考量,补充快手原创内容生态的同时,探索AIGC时代下的短视频产品形态;另一个是从商业化上考虑,利用大模型矩阵的能力降低品牌生成高品质短视频和直播内容的成本,提升线索转化率。
快手的AI战略代表了一类企业面对AI时代的心态。这类企业的特点是在PC互联网和移动互联网时代在某一个垂直赛道站稳了脚跟,拥有一定规模的用户,较难参与到底层基础设施的竞争中,增速放缓但业务相对稳定。快手之外,Soul、360、小红书等都属于这类企业。
Soul在内部达成了一个共识——单纯的技术并不能够去构建壁垒,其实说端内发展给用户带来价值,这才是各行各业的护城河。因此,Soul更多是针对满足用户的社交诉求,利用AI的手段来解决问题,而没有去追求AGI。在Soul APP CTO陶明看来,这种AI强化业务的逻辑,会给企业建立一条更具差异化的发展路径。
快手高级副总裁、主站业务与社区科学线负责人盖坤
这种逻辑本质上就是将AI作为放大器,达到持续放大业务已有势能的目的。提出要走CoE(协同)专家模型的360也是如此。这是一种大模型时代的入口逻辑,充分利用360原有产品的流量积累,将360和第三方的AI能力整合到一起,通过360的意图识别模型和任务分解调度模型进行需求与模型能力的匹配。
因其拥有一定的业务积累和用户基础,所以在制定自己的AI战略时不能像智谱AI、月之暗面那样丢下包袱轻装上阵,讲一个直指AGI的、重投资高风险的宏大故事。又因为他们的业务相对垂直,没有面向其他场景的丰富触点,也很难像腾讯、阿里、字节、百度那样在AI时代继续横向拓展,争取成为基础设施提供者的机会。
可灵们的机会在哪里
就可灵而言,它能够带给快手三个不同层级的可能性:
第一个是可灵真的成为OpenAI预想中的「世界模拟器」,快手借此获得一个冲出短视频行业的机会;第二是可灵成为新一代的内容创作工具,大大降低短剧等专业影视内容的创作门槛,让快手沿着视频产业链条向上继续延伸;第三是可灵降低用户创作短视频的门槛,极大丰富快手的短视频供给。
从迟迟未能上线应用的Sora,以及目前已经上线的可灵、清影、Gen-3、luma等视频生成大模型的使用体验来看,AI视频生成技术还处在非常初级的发展阶段。世界模型有可能像大语言模型一样,在经历过算法框架创新带来的初期发展红利之后,受限于训练数据、训练算力等条件的制约,在较长时间内停滞不前。
对于快手来说,AI+短剧可能是比世界模拟器更有几率实现的目标。在可灵开始研发的3月,快手就公布了短剧+的短剧战略布局,短剧+AIGC是这个布局中的一个环节。AI短剧《山海奇镜之劈波斩浪》的制作计划也是在同一阶段宣布,并原定于4月底上线。
最终随着可灵的快速上线,利用可灵重新打磨的《山海奇镜之劈波斩浪》于7月发布,并在上线十天后收获了超过5000万观看量。此外,抖音推出了与博纳合作的AI短剧《三星堆:未来启示录》,央视频发布了《英雄》《爱永无终止》《奇幻专卖店》三部短剧。
在可灵们的加持下,随着这些打样作品的上线,理论上能降低创作门槛的AI与赚钱的短剧相融合,快速勾勒出了一个低成本、高回报的AI短剧远景。博纳影业集团影视制作副总经理曲吉小江还提出了「从短剧走向长剧再走向游戏」的AI短剧三步走计划。市场也对于短剧的重要生态平台快手给予了厚望。
但是,从创作者的分享来看,可灵们可能降低了制作一部短剧的整体成本,但并没有将制作门槛降低太多。大模型虽然能根据提示词生成视频内容,并且在生成的视频时长和效果上也比半年前都有很大的提升。但是,大模型对提示词的理解、对画面的生成还存在很大的迭代空间。
一个很直接的例子是,在《山海奇镜之劈波斩浪》导演陈坤的介绍中,团队针对一个火神和水神打架镜头抽卡100次,也没能抽到特别满意的过程,「实际用的画面其实也是带了一定畸变的」。AI短剧的创作者需要的不仅是讲故事的能力,还要强化与AI沟通的能力。这并不是一个一蹴而就的过程。
目前来看,AI视频生成融合短视频生态最有可能在短时间内大规模铺开的,是第三种可能,让现在正在创作短视频的用户能更好地丰富自己的视频内容。一种已经能看到的趋势是,在快手和抖音上的一些口播创作者开始利用AI生成的视频匹配自己的口播内容,为观看者提供更生动的内容体验。
从原有内容的优化到AI原生短剧的规模化,再到内容创作者与内容消费者之间的界限模糊更有可能是快手在AI时代的三步走计划。对于同样在AI时代秉持聚焦型战略的企业而言,这三步走计划可以概括为优化已有功能、探索AI原生功能、实现用户的AI化。这是可灵们更能抓住的机会。