出走的字节高管,谁能造出「中国版Sora」?

蓝洞商业 2024-02-29 19:48:05

字节系创业者大潮将至,字节跳动还在等待「90分」。

撰文|蓝洞商业 赵卫卫

如果要给当下国内 AI 创业的弄潮儿打标签,一个是「清华系」,另外一个则是「字节系」。

「清华系」顾名思义,就是清华大学毕业生。远到百川智能创始人王小川、光年之外创始人王慧文(已被美团收购),近到不久前完成超10 亿美元融资的月之暗面创始人杨植麟、张宇韬……对于投资人们来说,创业团队来自清华,是一个最直接的加分项。

逻辑也很简单,毕竟投资先投人。OpenAI 大模型 GPT-4 的华人研发团队中不少人毕业自清华,清华的自然语言处理实验室等人工智能研究水平属于国内顶尖,那么在国内市场同样押注清华团队,错的概率就会降低。

同理,「字节系」成为投资人追捧的 AI 创业标签也大抵如此。谷歌早就是美国 AI 人才的黄埔军校,OpenAI 300 多人团队中有近 60 人都是谷歌的前员工,占比远高于 Meta 的前员工,那么,国内互联网大厂中谁能像谷歌一样储备如此多的算法技术人才?

答案就是——全球范围内增长速度快于谷歌的字节跳动。

抖音前音乐业务总监朱洁创立了 VegaX,主打方向是新技术变革下的 AI music,重点是如何继续服务好新作品,推动分发;字节跳动前 AI Lab 总监王长虎创办了爱诗科技,打造了视频生成工具 PixVerse,国际版已经正式运营了四个月;今日头条前用户产品负责人张前川,加盟了去年估值超12亿美元的创业公司Minimax,负责星野App;抖音前产品负责人Seven(王京津),加入清华系AI 创业公司深言科技……

「字节系」的创业者们在寻找适合自己的 AI 场景,或是创业、或是加入新公司,而字节跳动本身也在追赶 OpenAI 的速度,对人才的渴求依旧。

人的变动永远先于业务的变化,各家大厂莫不如此。

不光是抖音集团 CEO 张楠辞任,亲自下场主导剪映押注生成式 AI;TikTok 还从谷歌挖来了 VideoPoet 的项目研究负责人、高级科学家蒋路,负责视频生成 AI 的开发;字节 AI Lab(人工智能实验室)也迎来了阿里 M6 大模型的前带头人杨红霞,主导语言生成大模型的研发。

而站在当下,OpenAI 发布视频生成大模型 Sora 之后,国内 AI 创业团队和大厂们更加焦虑了:既然人无法与趋势为敌,那么这场变革的浪潮中,谁才能抓住为数不多的船票?

「字节系」出走创业

「陆育是明星创业者,应该有很多投资人在追。」一位知情人士透露。

2022 年 7 月,阳陆育从字节跳动离职。作为一个连续创业者,他最知名的标签就是 Musical.ly 创始人之一,Musical.ly曾在 2015 年成为美国最大的短视频社交平台,两年后被字节跳动以10 亿美金收购,产品改名为 TikTok,后来成为全球最大的短视频平台。

在 Musical.ly 被收购后,阳陆育进入字节跳动成为大力智能创始人,推出了大力智能学习灯。但是,随着 2021 年「双减」政策的落地,字节跳动的智能教育硬件业务也随之边缘化,阳陆育转岗到战略部门,一年之后离开字节跳动开始创业。

没有被抖音收购之前,阳陆育曾认为,「娱乐的全球化和移动互联网的低龄化」是当时创业中最大的两个机会。如今,OpenAI 带动了AI 赛道风起云涌,阳陆育再次投身其中,回到上海成立了远光灯数字科技有限公司。

招聘信息显示,2023 年远光灯数字科技的团队规模不到 100 人,主要业务是开发一款 AI 原生产品,面向海外市场的 to C 应用。

其公司介绍为,「从娱乐及社交场景切入,基于自建的垂直模型构建一个多 Agents 系统,打造下一代个性化娱乐和服务平台。技术栈涉及:大语言模型,文生图模型,语音模型,Agents,LangChain,推荐系统等。」

「创业项目还处在保密阶段」,知情人士透露,阳陆育团队的这款 AI 原生产品或许就与 AIGC 游戏相关,追寻最初的梦想,「娱乐的全球化」或许再次成为阳陆育投身AI 创业的机会所在。

与阳陆育回到创业起点一样,抖音前音乐负责人朱洁也在 AI 大潮之下,开启了在音乐赛道上的创业,他们都回到了泛娱乐的落地场景中,再次成为殊途同归的同路人。

2019 年,朱洁从字节跳动离职。在那个抖音神曲满天飞的年代,音乐平台的爆款歌曲往往都是在从抖音上走红开始。朱洁在抖音期间打造了抖音看见音乐计划、中国新唱将等多个项目,促成独立音乐人与抖音合作,扶持中国原创音乐力量的发展。

离开字节跳动之后,朱洁在 2020 年成立了奇音妙想科技有限公司,依然在音乐产业赛道中找寻细分的机会。奇音妙想曾推出一款名为「唱鱼」的APP,是一款面向音乐爱好者和音乐创造者的娱乐产品,用户可以玩原创说唱,也可以通过AIGC 智能编曲实现原创 K歌。

如今的朱洁也在顺应趋势的变化,「她创立了 VegaX 回到了 AI music,业务重点是如何继续服务好新的音乐作品,推动分发」,知情人士透露,奇音妙想与 AI 结合的新业务模型也将在今年上半年上线。

而除了阳陆育和朱洁,「字节系」的技术派们也都已经纷纷下场。

字节跳动 AI Lab 前总监郭传雄,在 2023 年成立了比特智路,从人工智能更底层的技术入手,解决基础设施所面临的可扩展性和通信效率问题;字节跳动AI Lab 前总监王长虎也在去年创立了爱诗科技,打造了视频生成工具PixVerse。

不难看出,字节跳动是「字节系」创业者难以抹去的标签。

朱洁依然在延续抖音时期的音乐梦想;阳陆育新公司取名远光灯,跟他在字节跳动做智能灯业务相呼应。即便是创业项目刚刚起步,但AI 的世界大门刚刚打开,他们凭借之前的能力,已经找到了属于自己的赛道。

「字节系」变相回流腾讯

除了投身 AI 创业,「字节系」的另外一个路径就是,加入一个上升期的 AI 创业公司,相比之下风险更低。

2023年的大模型创业热潮中,估值最高的两家公司就是 MiniMax 和光年之外,当时美团以 2.34 亿美元现金 +3.67 亿元人民币债务 +1 元钱现金收购光年之外,而另外一边的 MiniMax 刚刚完成 2.5 亿美元融资,估值超 12 亿美元,投资方包括腾讯和米哈游。

到了今年 2 月,大模型创业公司又有了新高度。

成立不到一年的月之暗面(Moonshot AI)被爆出新一轮融资 10 亿美元,但很快有消息人士指出,融资额为 8 亿美元,领投方新股东为阿里和小红书,投后估值约 25 亿美元,成为与 MiniMax、百川智能、智谱 AI 等同一梯队的大模型独角兽。

月之暗面备受追捧,再次验证了资本对「清华系」的热衷。

月之暗面创始人杨植麟和张宇韬,都是清华大学计算机系毕业,学生时代就跟随老师唐杰开始人工智能方向的研究,发表过多篇顶级论文,而且杨植麟在华为「盘古」大模型等研发上都积累了成功经验。

去年,国外科技媒体《The Information》曾盘点中国 AI 初创企业的 Top 5,杨植麟以个人名字入选,其他四家分别是 MiniMax、澜舟科技、智谱AI、光年之外。如今获得融资,尤其是 OpenAI发布 Sora 后,国内创业公司加快了追赶步伐,月之暗面预计将在今年上半年推出对标 GPT-4 级别的大模型产品。

明星级别的 AI 初创企业,自然不会放过对人才的渴求,尤其是「字节系」。

2023年,今日头条前用户产品负责人张前川就加入了大模型独角兽 MiniMax,负责旗下AI应用产品星野。MiniMax 于 2021 年 12 月成立,已有文本、语音、视觉 3 个模态的自研基础模型。2023 年 3 月,MiniMax 推出面向企业用户的 API 开放平台,支持文本和语音模型的服务调用。

无独有偶,抖音前运营和本地生活负责人王京津(Seven),也在去年加入清华系 AI 创业公司深言科技。在抖音任职的 2021 年,王京津负责的运营和本地生活业务,曾被分别分权给抖音市场负责人支颖和直播负责人韩尚佑兼管,如今,王京津成了深言产品负责人。

深言科技作为一家 AI 创业公司,同样主打自己是「清华系」,背靠清华大学自然语言处理实验室。

但对于「字节系」人才来说,加入一个明星大模型创业公司,未来很可能都离不开腾讯的标签。去年 MiniMax 的 A 轮融资,金额超 2.5 亿美元,背后的投资方就是腾讯集团的腾讯投资,这也被外界认定为腾讯在大模型领域的首笔已知投资,与此同时,深言科技也拿到了腾讯、好未来等机构的数亿元战略投资。

与字节跳动专注研发自己的大模型的业务驱动策略不同,腾讯在大模型领域依然采用广撒网的投资驱动策略,这就意味着「字节系」人才很大程度上会回流到「腾讯系」的 AI 初创公司中。

当然,AI 明星创业公司们对人才的渴望是迫切的,不只是「字节系」,连腾讯自己的人也是一样,人才的流动带动了创业公司与大厂们的业务合作。比如 MiniMax 如今的副总裁魏伟,曾经就是腾讯云的副总裁,负责开拓国际业务,2022 年之后,腾讯云为 MiniMax 搭建了从资源层、数据层到业务层的云架构。

字节跳动等待「 90 分」

毫无疑问,在 OpenAI 发布 Sora 之后,趋势已定,成为了 2024 年国内多模态大模型创业者发力的主要方向,而对于字节跳动来说,一方面是昔日的员工纷纷离职投身 AI 创业,另外一方面则迫切需要优秀人才的加入。

近期,昆仑万维创始人周亚辉在朋友圈表示,一位美国华人 AI Scientist 加入字节北美做 Tech Leader,随后有媒体挖出这个科研人才就是谷歌 VideoPoet 的项目研究负责人、高级科学家蒋路。

此外,周亚辉评价说,OpenAI 这一路的发展战略是教科书级别的,在这一波 AI 革命中可以打 95 分以上。

「不过这波 AI 中,字节 AI 战略也就 40 分吧,还是靠了家底厚,啥大模型矩阵,甚至不如谷歌,谷歌可以打 70 分。当然一鸣同学天才般的智力和悟性,Hands On 估计不出 3 月就会从 40 分变 80 分甚至 90 分。」

周亚辉还补充说,他强调的是字节过去一年半的 AI 战略,不是字节的战略。「跟 OpenAI 90 分的差距在哪里?缺乏更细节的颗粒度,比如下一代的信息平台是什么形态?新的时代信息入口、内容入口、Messenger 入口会不会三合一或二合一?(任何一个情况发生都是台阶式成长。)」

此番评价引发热议,周亚辉还剧透说,OpenAI 即将发布 GPT-4.5,并且可能故意会在 Anthropic(OpenAI 的前成员创立)发布的 Claude 3 的时间。

国内大模型发展水平,与 OpenAI 的差距有目共睹,字节跳动的 AI 战略能够达到 90 分,在今年追赶上 OpenAI 吗?这可能是包括周亚辉在内的许多行业人士的共同期待。

相比腾讯、阿里等大厂纷纷在投资大模型创业公司,字节跳动仍旧聚焦在自身大模型业务本身,推出过多款 AI 对话功能的产品,诸如豆包和 Cici、人工智能助理工具 ChitChop 及 AI 聊天机器人和应用程序编辑开发平台 Coze 等,而最令外界期待的,莫过于抖音 CEO 张楠辞职后亲自督战的剪映,剪映可能成为国内市场最先爆发的 AI 应用产品。

Sora 引爆文生视频赛道之后,国内大模型厂商的焦虑尽显,字节跳动首当其冲。

字节跳动曾辟谣,旗下 Boximator 目前还无法作为完善的产品落地,距离国外领先的视频生成模型还有很大差距。但随后,字节跳动发布了文生图模型 SDXL-Lightning,但在文生视频赛道,依然有很长的一段路要追赶,因为逻辑很简单,文生视频的视觉数据模型,必然会是在大语言模型的基础上发展而来,大语言模型的底子不结实,不可能有令人眼前一亮的多模态模型产品。

对于 2024 年的大模型行业来说,一大期待可能就是,字节跳动自身和字节系的创业者们,谁会先拿出爆款应用产品?在逐渐分化的阵营中,谁又会在超级应用里占据一个前排位置?

0 阅读:0