单季入账3.4亿元,可灵AI如何跨越商业化分水岭?|模态|新论文|可灵ai
在第13届中国网络视听大会热闹的展馆一角,快手自研的AI视频模型可灵的展台前,围满了前来咨询的创作者和影视从业者。从去年此时被追问“能做什么”,到今年被追问“如何帮我赚钱”,可灵在过去一年里,已然悄然跨越了一道关键的分水岭。
“去年和今年一个比较大的变化:一是模态在变得丰富,二是整体变得更智能化。”可灵AI产品及运营负责人温园旭在接受《每日经济新闻》记者(以下简称每经记者)采访时总结道。
![]()
图片来源:受访者供图
当行业还在讨论AI视频能否“用得上”时,可灵已经交出了商业化首份成绩单:2025年第四季度收入达3.4亿元。在这场由AI驱动的行业大变革中,可灵的进化路径,或许正勾勒出整个AI视频生成赛道从“技术狂欢”走向“价值兑现”的演进轨迹。
“去年和今年比较大的一个分水岭,是模态在变得丰富”
去年的这个时候,一位创作者告诉每经记者,要做一个魔幻的《山海奇境》AI短剧,需要调动10多人的团队。而一年后的今天,随着大模型工具的进化,这个门槛变得更低了。
“去年和今年比较大的一个分水岭,是模态在变得丰富。”温园旭向每经记者表示,过去,视频生成基本依赖“图片+文字”的描述方式,但文字对于时空关系的描述天然存在缺失。“每个人听到一段文字后,脑海里想象出来的画面都不一样,所以模态的变多就变得越来越关键。”
他透露,可灵已经开始集成更多元的输入模态,包括图片、视频、动作模态以及镜头模态等。这带来的直接变化,是虚实结合的可能性被极大地拓展。
他向每经记者分享了一个有趣的案例:一家与可灵合作的影视公司,利用可灵的动作捕捉能力,让一名表演能力很强的演员正常表演,拍摄下面部表情、肢体动作和台词后,再通过模型进行“叠加”,直接生成了一个奇幻的鬼怪或神仙角色,而这种能力,正在拓展AI在影视创作中的边界。
“模态的丰富,对那些创作力及细节把控非常强的专业团队很有价值。而智能化水平的提升,对更广泛的创作者群体而言同样意义重大。”温园旭表示,很多用户更倾向于“一句话出片”,希望直接得到一个效果不错的成片。“这也是为什么在1月底推出的可灵3.0版本上,我们把模型生成的视频时长进一步拉长,同时提供了分镜能力和自动切镜能力——用AI来帮助你讲好一个完整的故事。”
在他看来,整个AI视频生成赛道的发展脉络,除了基础模型能力的持续“内卷”外,更大的两个趋势就是多模态和智能化。这两个维度正变得日益重要,成为各家竞相追逐的焦点。
商业化的“中国路径”:成本优势与全球定价逻辑
当技术逐步成熟,商业回报便成为悬在每一家大模型公司头顶的“达摩克利斯之剑”。与通用大语言模型普遍面临的“免费尴尬”不同,视频生成赛道似乎找到了更顺畅的变现通道。
“视频创作领域的付费意愿,不管是to B还是to P(专业一些的C用户),都明显更强,且这一趋势正在全球范围内显现。”温园旭向每经记者坦言。
温园旭认为,真正愿意付费的是那些专业创作者,他们的用量大,对模型的要求高,同时也会反哺模型的进化。
在商业化路径上,可灵已形成B端与C端双轮驱动的业务结构,目前两者体量“相对接近”。B端方面,可灵已深入渗透传统影视工业。一个标志性案例是,今年央视开年大剧《太平年》中部分镜头使用了可灵AI。
当每经记者问及面对国内外竞争对手,如何在价格战中构筑差异化优势时,温园旭表示,海外市场格局正在变化——Sora已经关停,而仍在运营的竞品如Google Veo定价普遍偏高,受益于国内基建与电力成本优势,可灵的模型成本更具竞争力。
他直言,可灵在海外的定价优势并非刻意压低价格,而是“对手定得太高了”。谈及国内市场,他表示竞争环境更为复杂,部分对手可能并不考虑短期利润或营收平衡。但可灵坚持自己的逻辑——“价格上面我们还是会相对走自己的逻辑”,因为“目前AIGC工具的成本在整个创作成本里还不是特别大的部分。”