对话昆仑万维方汉:冲击AI巨头的野望和决心
(原标题:对话昆仑万维方汉:冲击AI巨头的野望和决心)
1995年,方汉毕业,进入中国高能物理研究所工作。中国第一条互联网专线建成,正是从这里通向世界。他第一次握紧鼠标上网时,像被电流击中。
此后几十年里,方汉一路做到昆仑万维(300418.SZ)的董事长兼CEO,公司年营收超过50亿元,但他很少再有那种感觉。
图片来源于网络,如有侵权,请联系删除
直到GPT-3生成的文字跳出屏幕时,他再次“过电”。在他50岁的时候,眼中出现了最大的机会――AI必将洗牌内容行业。
或许真的体会到了“天命”,方汉“燃”起来了,每天少睡1―2小时,一年下来读超过200篇论文,在一线敲代码、搭团队,面试算法博士。
为了追赶AI,昆仑万维投入巨大――8亿元砸向算力芯片,成为算力最充足的AI企业之一;2024年研发费用增至15.4亿元,同比增长近6成。前者买燃料,后者炼大脑。
图片来源于网络,如有侵权,请联系删除
这样的投入力度在业内颇为罕见。年报显示,2024年,昆仑万维归属于上市公司股东出现亏损,这是昆仑万维上市十年来的首次年度亏损。
在方汉看来,这更像是一种交换,换卡、换时间、换人才。
“这种交换有代价的,犹豫的成本更高。”方汉对经济观察报说。
图片来源于网络,如有侵权,请联系删除
提前布局,使昆仑万维成为最早发布自研模型的企业之一,夺得多个垂类领域首发,为它带来了增长。
2024年,昆仑万维营收为56.6亿元,同比增长15.2%;整体毛利率为73.6%,在互联网行业中处于较高水平。
昆仑万维可以烧钱,但不能乱烧,技术团队最常受到方汉的灵魂拷问:“这个模型能排到全球前三吗?”
全球前三,在这家企业里有着明确的定量指标,即权威技术测试指标达到SOTA(最先进的模型)。
为了达成这个目标,昆仑万维内生Fast Fail(快速试错)机制:所有项目必须在短时间内验证可行性,技术进不了前列,要迅速调整甚至叫停。
比如,去年方汉叫停了AI漫画项目,尽管他们曾投入数百张算力卡,但模型能力始终达不到预期。资源被进一步集中到更具突破潜力的AI音乐、AI短剧、AI社交等领域。
这一策略使得昆仑万维的AGI与AIGC业务也进入快速商业化通道:2024年,昆仑万维的AI业务年化收入达到1.4亿美元,成为海外收入增速最快的中国AI企业。
其中,AI社交在报告期内单月最高收入突破100万美元,成为海外收入增长速度最快的中国AI应用之一;截至2025年3月底,昆仑万维的AI音乐年化流水收入达到约1200万美元。短剧平台Dramawave年化流水收入达到约1.2亿美元。
方汉说:“技术水平达不到前三,根本没有参赛资格,砸再多钱营销也守不住用户。百团大战、打车大战,太多企业都是这么死掉,昆仑万维17年来看得太多。”
把擅长的事做到全球第一
2024年初,昆仑万维投入数百张GPU训练AI漫画生成模型,起初团队非常兴奋,准备大干一场。
很快,他们意识到,AI漫画所需的细分技术,如漫画风格迁移、分格生成、剧情管理等并非主流。投入重金后,昆仑万维的模型能力也无法从数千家文生图企业中突围。
更致命的是,漫画的市场规模和用户付费意愿有限,短期内难以取得足够回报。这个曾被寄予厚望的项目仅存活了3个月。
自去年以来,AI行业开启淘汰赛。业界普遍认为推动大模型发展的第一定律放缓。这意味着投入与回报不再是一分耕耘,一分收获,而是千分、万分投入,回报可能不到一分。
选择或比努力更重要。昆仑万维放弃了AI漫画,转向音乐等赛道,首先聚焦在旗下坐拥3.1亿注册用户的音乐平台Starmaker身上。
早在2021年,Starmaker平台日均上传作品达200万,为昆仑万维带来了广告收入。这里有一个过去被忽视的需求:喜欢唱歌的人也想创作歌曲,但人们对成本这一“拦路虎”发怵。过去,做一首歌曲的成本达数万元,请乐队、租录音棚、制作伴奏都需要钱。
团队想到“用AI把创作成本打下去,下一个巨星为什么不能诞生在这里呢?”
正如贾斯丁・比伯在YouTube上翻唱歌曲的影片被星探发掘,这带火了平台也成就了巨星。
2024年4月,Mureka V1(SkyMusic)上线,这是全球最早上线的音乐生成工具之一。
一位中国用户使用Mureka创作的38秒爆款歌曲《还我妈生鼻》一战成名,5天播放量破百万,冲上抖音娱乐榜及微博热搜第一。
2025年3月26日,昆仑万维正式发布Mureka O1模型与Mureka V6模型,支持西班牙语、日语、英语等10个语种歌曲生成。访问用户遍布超100个国家和地区。在第三方评测中,Mureka O1,击败美国音乐大模型Suno,登顶全球第一。
在Mureka上,一首4分钟歌曲从生成到发布不到1分钟,用户侧成本仅需1―7毛钱,企业侧成本不到5分钱,这一价格低于同类应用――用户能省钱、昆仑万维能赚钱。
发布当周,Mureka官网十分火爆,用户经常会看到有几十位创作者在等待生成歌曲,其中不乏许多海外用户。
国际作者和作曲者协会联合会预计,未来五年,人工智能生成的音乐和视听内容全球市场将增长20倍,收入规模从目前约30亿欧元增至2028年的640亿欧元。
此外,AI短剧方面,昆仑万维在2024年8月,推出全球首个集成视频大模型与3D大模型的AI短剧创作平台SkyReels;在2024年下半年,发布DramaWave短剧内容平台,覆盖不同消费层级的全球用户群体。目前,昆仑万维的业务覆盖全球100多个国家和地区,全球月活跃用户接近4亿。
方汉认为,AI音乐、AI短剧只是一块拼图。昆仑万维还在持续投入AI社交、AI游戏等领域,最终都指向娱乐赛道。这些领域的共同特点是:用户容错度高、付费意愿强。而全球80亿人口中只要有1%成为付费用户,就将催生千亿级市场。
在大厂抵达前把握窗口
一旦巨头切入自己的细分市场怎么办?这是每家AI公司的必答题。
作为一家中厂,方汉选择用“苦功夫”和“灵活性”来迎战大厂。
首先,他选定了相对冷门的AI音乐、AI短剧等娱乐赛道。相比对算力、数据需求高得惊人的文本大模型,这类模型的竞争尚未“卷”到极致,也没有巨头出现。
二是下苦功夫,建立护城河。
此前昆仑万维曾购买了200万首正版歌曲授权,但音乐公司不提供母带,团队只能用算法一首首剥离人声、重建伴奏,积累了海量数据,其拥有的音乐语料仅次于腾讯、字节和网易。
大厂即便立刻进军AI音乐,用人海战术或者“钞能力”,也同样需要一首首积累数据。这意味着昆仑万维还能吃到一段时间的红利。
自10年前该公司就在非洲等海外市场投入大量精力,派工程师到蚊虫肆虐、疟疾频发的当地摸清手机硬件环境。
他们发现许多手机在千元以下,必须优化到音频芯片层面,才能显著提升音质。“大厂觉得太苦、太难,对难挣的钱兴趣不大。”方汉说。
灵活性也是昆仑万维的优势:从决策到拍板“All in AGI和AIGC”,他们只花了7天,随后立刻买卡、加大研发开支。
2022年底,ChatGPT横空出世时,别的公司还在观望,他们用一个春节假期就明确了这件事。
在接下来三年中,他们内部调配AI相关的资源也延续这种灵活,只需要碰头开会,对齐、推演、复盘当前的需求,随后资源就会到位。
在内部验证效果好的AI算法或产品,即可获得核心研发力量的增援;在市场上获得用户增长、订阅增长等反馈后,即能拿到更多算力、人力资源。
相比之下,大厂往往得先兼顾国内成熟业务,流程复杂,审批周期冗长,出海或短期难以盈利的项目更边缘,可能数月甚至半年才能排到资源,容易错过窗口期。
马车夫追上汽车时代
方汉是中国第一批接触互联网的人,也是开源操作系统Linux的第一代中文核心作者之一,和他们那批人中的多数一样,信奉开放、自由、去中心化。
面对AI冲击,年过半百的方汉过去几年一直在做两件事:读技术论文和招年轻博士。
他一年读了超过200篇前沿论文,每周花大量的时间在看论文、研究技术,压缩休息时间,为此每天牺牲了一两个小时睡眠时间。
方汉说:“我们都是旧时代的马车夫,在汽车出现后,一定要努力地学开车,而不是去砸人家车。”
除此之外,他常常挤出午饭的时间,面试有潜力的博士,再小的项目都会问上至少1小时,从基础公式推导到工程细节把控,筛出真正的创新者。
有意思的是,比起有大厂经验的老将,刚走出校园的博士更受青睐――方汉认为,他们未被行业惯性束缚,常带来意想不到的突破。
一次内部技术讨论会上,一位新人博士提出了个大胆的想法:把文本模型的注意力机制“移植”到音乐生成上。这番设想起初听来有些异想天开,但经过交叉质询和推演后,反而衍生出一条全新的算法思路。如今该算法已成为Mureka模型的一个核心创新。
方汉认为,从技术背景来看,所有人都是在2023年才开始转向GPT相关的架构研究,相当于站在同一个起跑线上。这一时间点后毕业的博士,更深耕、也更有价值。
昆仑万维设立2050研究院,这里聚集了一批深谙神经网络和算法架构的年轻研究员,目标直指AGI(通用人工智能)。
如果说快速试错体现了昆仑万维的效率,那么设立2050研究院和坚持开源则保留了一抹理想主义色彩。
这里没有短期的盈利考核焦虑,也无需层层审批的繁琐流程――当团队在会议室里碰撞出可行的创意,算力资源和人力支持就能即刻就位。
极客式管理模式,让需要长期培育的种子项目有了一定空间。从语言大模型到视频生成算法,昆仑万维近两年已开放超过20个大模型以及高质量的中文训练数据集,在开源社区累计下载量超过6万。
其中,昆仑万维开源的Skywork R1V多模态思维链推理模型达到开源SOTA,位列同类型开源模型全球第一。此外,大模型学习强化Skywork-Reward奖励模型亦达到全球第一,成为数据科学竞赛平台Kaggle官方推荐的数学奖励模型。
与很多同行不同,方汉认为,只有让更多人参与,才能持续迭代增强模型,进一步沉淀用户与影响力。通俗来讲,做AI产品就像卖包子,只有开源基础配方,才能催生千变万化的创新。
这套被方汉称为“包子铺哲学”的开源战略,正在创造生态。
以其2月18日开源的SkyReels V1视频模型为例,自上线以来,已被下载3万余次,在Github亦收获逾千星的点赞,开发者们基于基础模型开发,满足一些意想不到的长尾需求,反而帮昆仑万维拓宽了商业场景,带动AI短剧的订阅用户暴涨十几倍。
“作为一家中型互联网公司,昆仑万维唯一的梦想是成为巨头。”方汉对AI未来的判断是,3―5年内,线下劳动力无法被完全替代;长远来看,20年内AGI的变革力会渗透至每一个行业。
“他们高估了短期,低估长期带来的变革”。
推荐阅读:
2023年私募五大策略业绩揭晓 债券策略以超9%的收益率领跑
吉宏股份下跌5.17% 2023年净利润预计增长80.00%—100.00%
专题推荐: