界面新闻记者 |王百臻

界面新闻编辑 |姜妍

2月12日凌晨,埃隆马斯克在社交平台X上发表了一则简短的推文:“It's happening fast”,而此前,在地球的另一端,《黑神话:悟空》的制作人冯骥也无心睡眠。他在推文中说:“AIGC的童年时代,结束了。”

这场横跨时区的共振,源于数天前的一次震荡。2026年2月7日,字节跳动旗下的新一代AI视频生成模型Seedance 2.0开启内测。这款低调发布的全新视频生成模型展现出了极为稳定的运镜效果以及可靠的多模态创作方式,引发社会高度关注。

眼下正值冬奥会进行之际,在官方发布的一条视频当中,呈现了15秒的双人冰上竞技花滑片段,先后演绎了同步起跳、空中旋转、精准落冰等一系列高难度动作。在复杂且连贯的运镜之下,视频成品自始至终保持着对现实物理运动规律的遵循,并未犯下此前AI影像中常见的物理谬误。

截图自字节跳动官网

这场“突进”在全球舆论场中引发了两种截然不同的反应。一方面,许多创作者早已期盼着一款更稳健好用的视频模型;而在另一边,也引起了一场关于“原创”与“真实”的恐慌。面对争议,Seedance团队紧急回应,其正对部分问题进行进一步优化,并暂时叫停了真人素材参考。

自2016年对抗神经网络踏入视频领域算起,视频生成模型已迎来了属于自己的第十个年头,并终于行至更大规模商业化的前夜。倘若向前再踏一步,又将发生什么?我们将迎来的到底是创作能力的平等赋权,亦或是人类灵性的损毁?而当全流程实拍已有可能变为一种小众消费品时,我们应当感到轻盈,还是会陷入无可避免的失落?

AI影像的十年跋涉

1970年,媒体理论家吉恩扬布拉德在其著作《扩展电影》中畅想了这样一种未来:真正的未来影像,不应该再被胶片、银幕与固定时长所束缚,而应当像生命一样处在持续生成的“进行时”。这位理论家写道,“当我们谈论扩展电影时,我们其实是在谈论扩展意识。”“扩展电影根本不是电影:它像生活一样,是一个不断成为的过程。”

在扬布拉德的设想中,影像不再只是对现实的记录,其终会走向对世界的模拟、重构与再发明;而观众也将不再在黑暗里被动观看,他们会走进影像,参与它、改变它,然后反过来被它所塑造。这既是某种想象,却也像极了一则预言。环顾四周,此刻的人类正如扬布拉德所言,踏入了一个“人机共生”程度前所未有的时代,享受着技术为我们所搭建的新自然。而当我们的观看列表里充斥起越来越多的AI影像之后,这种感觉便会愈发强烈。

我们究竟因何契机踏上了这条由扬布拉德所指明的路?毕竟,回望过去,视频生成技术的发展历程本非一片坦途。仅仅三年前,AI生产的内容大多依旧怪诞且“抽象”。彼时,一位Reddit用户使用一款名为ModelScope Text-to-Video的扩散模型,在输入提示词“威尔史密斯吃意大利面”后,生成了这样一段视频——画面中,难以辨识的“威尔史密斯”面对着蠕动的意大利面,其面部不断变形,手指和叉子反复融合、面条则时不时像触手一样钻进耳朵。这部充满“克苏鲁风格”的怪诞影像成为当时的人们质疑AI影像潜能的有力佐证。

截图自相关视频

以今天的眼光来看,这类视频既反映了早期AI视频生成算法的缺陷,也加剧着如今的我们遇见Seedance时的震撼与不安。

把时间回拨到2016年,计算机领域的前沿学者们正兴致勃勃地尝试着一种名为对抗神经网络的先进新算法,并将其用于图片与视频生成。那时,Carl Vondrick等人发表的论文《Generating Videos with Scene Dynamics》成为该领域的早期代表性工作之一。通过让机器观看大量无标注的视频,他们试图教会算法理解海浪如何翻滚、火车如何行进。刚开始,人们仅仅做到了“让静止的图像动起来”。而后,新的范式不断涌现,为AI视频生成提供着更可控、更可用的新思路,但其仿佛离真正的“商业化可用”永远间隔着一段难以逾越的距离。

于是,虽然身处一个百花齐放的时代,但AI影像技术的发展势头并未真正引起影像产业的注意。起初,这种高度不成熟的算法只是停留在实验室的电脑里。而后,先锋艺术家和短片艺术家们尝试着接纳了它们。相较而言,他们并不那么在意这些模型所输出的那些令人费解的错误,反而却将“幻觉”以及偏离视作一种全新的艺术语言,并借此打造了一种以发散、开放为特征且格外难懂的新风格。

与这种难以捉摸的迷人实验性相伴随的,是早期模型里难以根除的紊乱与不可控。每次使用算法生成视频都宛如一场赌博,用户无法知道下一秒蹦出来的会是惊喜还是惊吓。威尔史密斯吃意大利面的低保真视频正是由此成为了一场全球范围内的爆火迷因,人们兴奋地挪用且分享它,并非是将其视为可用的素材;相反,面对这种“难绷”的故障和崩坏,低能的AI成为了那个可以随意揶揄嘲讽的“人工智障”。

2023年,AI视频终于踉踉跄跄迎来了自己的产品化纪元,但其使用者们或多或少依旧置身于一种“高科技默片时代”。音画不同步是彼时一项难以逾越的技术难题,与此同时,早期模型的不可控性虽减轻了许多,但差错依旧时不时蹦出来,并随即径直打破观看者的第四面墙。随着技术的发展与成熟,AI生成的威尔史密斯似乎慢慢学会了如何正确地使用叉子,但他偶尔还是会在进食中途把面条吸入鼻孔,或者在咀嚼时下巴突然融化。

回顾这段曲折的道路,我们不难醒悟,为何今日自己点开热搜会如此惊讶。当我们打开视频网站,观看Seedance 2.0及其作品时,发觉这款模型已在不知不觉中翻越了重重高山,而AI影像也正缓缓告别着其“默片时代”,大步走向着属于自己的有声电影纪元。

AI影像正缓缓告别着其“默片时代”(图源:pixels)

长期以来,AI视频最大的违和感来源于“音画割裂”。角色说话时嘴唇的开合往往与发音脱节,在观看者看来,这些如同拙劣的译制片或腹语表演的瑕疵效果往往难以忍受。Seedance 2.0在底层模型上实现了音频与视频的联合生成。它能够根据具体场景生成匹配的音效和配乐,也实现了帧级精度的口型同步与情绪匹配。这种多模态的协同,让AI角色第一次产生了类似于“演技”的观感。

而在声音之外,Seedance 2.0还呈现出了对镜头语言的惊人掌控能力。它内置着导演级的运镜逻辑,不再需要人类手动拆解每一个机位。此外,其还能够根据故事情节自动规划分镜。相比之下,在过去的AI工具中,指挥模型进行复杂的运镜往往是一项艰难的挑战。即便使用者具备相关知识,并精确地使用了“镜头左移”“推轨”“希区柯克变焦”等复杂的提示词,模型也无法确保提供稳定且可用的画面。

当AI开始学会用镜头讲故事,其也意味着影视制作中难度颇高的“调度”与“运镜”逐渐被封装进算法当中。如果仅从效率主义的视角来看,这一次迭代,毋庸置疑是一场属于技术的胜利。

然而,效率之外呢?

影像产业将何去何从?

倘若我们仅仅将Seedance 2.0以及与之类似的工具视为纯粹的效率工具,则很有可能严重低估其真正蕴含的能量。譬如说,面对来势汹汹的 Seedance2.0 们,传统影像工业体系还经得住吗?

纵观曾独属于人类的百年电影史,正是人类创作者的精心操作,造就了那些迥异的影像风格。一部影片得以完成,必然依赖于摄影机对物理世界的捕捉,也往往依赖于布光、走位、实景搭建以及随后漫长的剪辑和拼接。而此刻,这一切繁复但可为人类所理解的生产流程,却正被AI以一种黑箱式的一次性生成所替代。那座曾经庞大、精密的电影工业金字塔,或许正面临着颠覆的风险。

好莱坞(图片来源:pixels)

事实上,风险并非始于今日。在Seedance 2.0引发海啸之前,以漫剧为首的商业形态已率先成为巨头们测试AI成色的抢滩阵地。

2026年2月4日,腾讯在各大应用商店低调上线了其首款独立漫剧App——“火龙漫剧”。这款由深圳腾讯计算机系统有限公司直接开发的试水产品,其动作之迅猛却丝毫不见“尝试”的犹豫。同日,中文在线发布公告,确认与腾讯达成高达2320万元的漫剧授权合作。

腾讯的这次尝试并非孤例。观察业界动态便不难察觉,这似乎是一场蓄谋已久的围猎。截至目前,字节跳动旗下的红果短剧早已将漫剧作为核心板块,百度推出了“柚漫剧”,快手、B站、爱优腾芒等长视频巨头也纷纷下场。它们或举办AI创作大赛, 或直接成立漫剧频道。

截图自苹果应用商店

如今,AI漫剧赛道的跑通,已充分验证了一条全新工业流水线的可行性。在这里,编剧取代了导演,而提示词则取代了摄影机。曾经需要多人分工合作且耗时数周的漫剧制作,正蜕变成一种低成本的自动化竞速游戏。另一方面,当今时代内容生产过剩,观众的注意力成了稀缺资源,对于早已陷入零和博弈的内容市场而言,AI入局也可能会引发更惨烈的挤出效应。

1月,瞭望财经与快思慢想研究院就国内AI视频生成产品现状及发展趋势,发布了《2026年国产AI视频生成领军产品竞争力报告》。该报告显示,当前AI视频营销项目平均投资回报率达到1:5.7,AI视频广告、AI漫剧、AI网剧已成为爱优腾等传统视频平台、红果等网剧平台的热门生产模式。在运用形式上,高端制作团队多采用“虚拟拍摄+AIGV”模式,小型制作团队主要采用纯AIGV方式生产短视频商业作品。2026年,AIGV网剧单集视频制作成本将只有人工拍摄的约1/10。

就在不久前,头部AIGC创作平台“巨日禄”的CEO斯宇也曾对媒体抛出一份数据:通过他们的一站式AI创作平台,一部精品真人AI剧的制作成本已被压缩至约1000元/分钟。而这是在Seedance 2.0发布之前的数字。随着Seedance 2.0带来的“原生多镜头叙事”与“零后期”能力的普及,AI生成的成本优势或将被进一步拉大。或许在未来,全流程的“真实”将变为一种昂贵的奢侈品。那些纯粹的实拍、精湛的人工制作,则如同手工机械表一样,退守为一种极少数人从事的小众艺术。

相较于AI影像,全流程人工拍摄往往更为昂贵(图源:pixels)

从业人数萎缩的同时,相关岗位也不免同步缩减。其实早在两年前,岗位危机便已初现端倪。2024年2月,美国电影大亨泰勒派瑞(Tyler Perry)在目睹了Sora的演示后,无限期搁置了他位于亚特兰大、总投资高达8亿美元的摄影棚扩建计划。他在接受《好莱坞报道》采访时,直言不讳地将许多影视相关岗位列入了高危名单:“很多人或将失去工作……这让我非常震惊。”

2024年6月,北美影视工会(IATSE)经过与好莱坞制片厂的艰难谈判终于争取到了所谓的“AI保护条款”。但在技术迭代的巨轮面前,纸面上的协议往往更加滞后,显得苍白无力。

而Seedance 2.0及同类产品的问世,于传统影像工作流中的多个岗位无异于又一次沉重打击。譬如就剪辑师而言,此前同类AI产品生成视频的过程看似自动,其实依旧需要剪辑师进行大量的拼接、修补及其他后期工作。然而,Seedance 2.0能根据单一指令,自动生成包含运镜、转场的整段视频。传统剪辑师赖以生存的“蒙太奇”技艺正被算法内化为其生成过程的一部分,其自身也可能会进一步沦为算法表演的旁观者。

在不知疲倦的算力中心外,一个纯粹的人类影像制作时代,或许真的正在远去。

救赎之光,抑或是即将消散的“灵光”?

1934年4月27日,本雅明站在巴黎的讲坛上,发表了题为《作为生产者的作者》的演讲。在这篇经典文本中,本雅明勾勒出了一种颇为激进的艺术功能观:艺术的政治使命不在于悲悯地俯瞰大众,而在于改造生产工具,将原本被动、沉默的消费者,转化为具备主体意识的参与者、创作者。

他援引了当时前苏联报纸的转型作为佐证。在本雅明的观察中,读者的书写能力不再受困于精英阶层的专门教育,而是化作一种公共财产。当“作者”与“公众”的界限开始消融,文学能力的特权得以松动,每一位读者都随时准备着跨越那道隐形的门槛,成为创作者。

在媒介演变史上,报纸曾重塑内容创作与消费的关系(图源:pixels)

跨越近百年的时光,在愈演愈烈的AI视频浪潮中,这种“技术民主化”的宏大叙事话语似乎再次找到了回声。

当Seedance 2.0这版强悍且触手可及的视频生成模型问世,社会上涌出这样一种论调:技术正在为那些原本缺少资源的“普通创作者”们赋权。这或许正是本雅明所呼吁、却在此前从未真正降临的那道“救赎之光”。尽管在算法的侵蚀下,某种独属于人类情感的、难以名状的“灵光”似乎正加速消散,但创作的权利却在骤然间被前所未有地平等化了。那些曾被表达门槛、资金匮乏或技术壁垒劝退的“普通人”,仿佛第一次握住了打开创作之门的钥匙。

从数据上看,这种转变在很大程度上并非幻觉。根据B站2025年第三季度财报,每月有近10万AI相关UP主活跃在平台上,AI内容日均投稿量同比增长83%,播放时长增长近50%。而《中国网络视听发展研究报告(2025)》的数据则更为直观:在10.91亿网络视听用户中,近1/3的网民已经开始尝试使用AI制作图片或视频。

于是,此刻的我们正见证着这样一种现实:AI应用的全面铺开真的帮助着一部分个体实现了由消费者转向创作者的身份跃迁。在这一过程里,技术所扮演的角色则宛如赛博朋克设定集里的“义肢”,它们原不是身体的一部分,却又在很大程度上构成了自我行动能力的外延。譬如,社恐的创作者可以通过AI声线规避声音羞涩,而缺乏预算的想象力天才则无需实拍,仅凭提示词即可构建宏大的史诗画面。

然而,当生产力的闸门被暴力推开,随之而来的并非全然是创作的乐土。对于影像产业之中的人们而言,生产流程的嬗变、分工模式的瓦解以及版权归属的乱局已是肉眼可观的挑战。但在这之外,我们是否低估了其他一些更为隐秘且沉重的代价?

首当其冲的,是个体生物信息的“失守”。

面对骤然问世的 Seedance 2.0,知名博主、影视飓风创始人Tim(潘天鸿)发布了一条实测视频。在视频当中,他并未吝啬对这款“改变视频行业”模型的赞美,无论是生成画面的精细度、复杂的运镜逻辑,还是分镜的连续性与音画匹配,Seedance 2.0都展现出了某种令人战栗的统治力。

不过,Tim也谨慎地在视频最后分享了另一个细节:“在没有给任何提示,任何词语,任何信息的情况下,我也没有给我的声音文件,只是把我的脸传上去,这个AI居然知道这张脸的声音。”

截图自影视飓风

在这种“精确匹配”的背后,隐藏着算法对个体数字主权近乎掠夺式的越界。其早已超出了简单的模仿,更近乎于一种基于大数据的“推理”与“补全”。肖像权的概念在算法的凝视下正变得支离破碎,在未来的数字世界当中,挪用一个人的身份信息或许不再需要复杂的黑客技术,只需要一张照片,AI便可完成。

而在个体信息的挪用外,对于造假的讨论也再度回温。当下,造假的门槛与代价不断被拉低,辨别真伪的能力却成为了罕见的特权。在这一过程当中,AI技术的进步所扮演的角色则颇为暧昧:一方面,更好的技术有能力成为人类辨别谎言的“照妖镜”。许多科技企业在自己的算法深处埋下了难以去除的签名系统,从而可为其所生成的内容加注数字水印或影像元数据。此外,诸如深伪检测模型(Deepfake Detection)等独立检测工具也在不断更迭,试图与造假者进行一场永无止境的军备竞赛。

但在另一方面,这种猫鼠游戏正变得越来越令普通人感到力不从心。技术的发展不可避免地催生出人眼甚至专业软件都难以辨别的AI生成品。随着视频生成技术越来越擅长还原物理世界的光影折射与肌肉颤动,对“真实”的确认正变成需要经由昂贵技术认证才能获得的“特权”。如今,对于绝大多数个体而言,我们或许已一步步失去那种“亲眼所见即为真”的安全感。

最后,在这些显性社会风险之外,当我们重新回望创作本身,一处潜藏在创作基座下的危机也正悄然浮现:AI视频的底层原理,本质上是对人类既有素材的暴力式拆解、学习,以及对现成风格碎片的挪用与缝合。如果一种“创新”的底层原理依旧是极其高明的“重复”,那么,人类创作的未来究竟在哪?“原创性”又将何去何从呢?

在《我生命中的幽灵:关于抑郁、幽灵学和失落未来的写作》一书中,马克费舍尔提出一则断言:“未来”作为一种能够带来根本性变革和异质性的力量,已经从我们的文化地平线上消失了。费舍尔认为,现代文化已经进入了一种“幽灵学”状态:我们被困在了一个只有“永恒的现在”和“不断的怀旧”的时间循环里。21世纪的文化不再产生真正的冲击力,它只是在用数字技术不断翻新20世纪的残影。

我们惊叹于Seedance 2.0的迅捷,并感慨其能够在刹那之间,生成一段“直接电影式”或“赛博朋克风”的视频。但此刻的我们是否正如费舍尔所言,亲手加速或见证着未来的终结?当所有可能的组合都已被算法预演,那道本雅明所期待的、通往解放的救赎之光,最终还能否如其期待般照亮未来?我们又是否已然踏进了一片巨大、静止且不断自我重复的数字荒原?

前方是乐园还是迷宫,我们尚不得而知。但在未来真正到来前的此刻,或许,我们依然持有选择的权力:并非无条件接纳技术所给予的一切,也并非全然选择恐惧与排斥,而是与技术建立理解与对话,并在守护人类权利底线的前提下,审慎地寻找出口。