当下国内大模型领域风头最劲的明星,当属北京月之暗面科技有限公司(以下简称“月之暗面”)旗下的智能对话助手Kimi。
凭借“长文本”功能,短短一个月时间里,Kimi便出人意料地进入了各方视野,在资本市场掀起了狂风巨浪;并让百度、360等巨头紧急筑起防火墙。
今年2月,刚刚创立一年的月之暗面拿下了一笔超大额融资:以15亿美元的投前估值,撬动了8亿美元投资——其中绝大部分来自阿里。交易完成后,月之暗面投后估值约25亿美元(折合人民币180亿元),成为现今国内大模型赛场上估值最高的独角兽。
这笔“豪华”的融资,引发了各方猜测。据市场消息,月之暗面一次性向阿里出让了40%的股份。不过,这引发了市场对公司未来发展独立性的担心。
据「市界」从某VC资深合伙人处了解,Kimi与阿里的此次“联姻”,是由金沙江创投管理合伙人张予彤在新加坡牵头促成的。
“阿里的8亿美元并非全是现金。据我了解,实际出资金额不到6亿,其中部分将以阿里云提供的算力结算。”该合伙人表示。
值得玩味的是,金沙江创投创始人朱啸虎3月在接受《腾讯科技》访问时,曾大谈“AI无用论”;有投资圈人士称,金沙江也间接参投了月之暗面。「市界」就此向月之暗面公司求证,对方回应称:“月之暗面与阿里的合作不存在第三方‘撮合’的情况。金沙江未参投月之暗面。”
这宗疑团重重的“高端局”,注定只属于金字塔尖的玩家。供职于一家腰部投资机构的投资人Lee,向「市界」感叹月之暗面投资阵容之豪华:“不用问,我们这种小机构投不进去的。”
另一位VC资深人士则对「市界」表示,月之暗面的高估值与AI赛道的退出难度“劝退”了不少机构。此次月之暗面之所以火速“作价”引进阿里,一方面因为阿里投资团队一直积极在AI市场上寻找标的。另一方面,也印证了月之暗面风光背后对资金渴求的急迫。
不过Kimi也在向各方证明自己“物超所值”的潜力。
3月21日,Kimi一度冲进App Store 免费版应用第5名,超越了微信;其小程序、App、网页版均因超出承载能力而宕机。据统计,2024年3月,Kimi智能助手月访问量达1218万次,仅次于百度文心一言,超越了阿里通义千问、字节旗下豆包。
在二级市场,它也一度复现了ChatGPT“带货能力”的势头,引发了一众“Kimi概念股”狂飙猛涨。其中华策影视、掌阅科技、中广天择、海天瑞声等多家企业,多次出现涨停。
这场大模型盛宴,有人坐在餐桌上,也会有人在菜单上。而月之暗面正在竭力让自己的位次向前一些。
01、Kimi这条鲶鱼
2023年2月,清华大学和卡内基梅隆大学的双重学霸,连续创业者、知名AI科学家杨植麟,带领旗下的豪华创业团队,创办了月之暗面;而Kimi正是杨植麟的英文名。
从创业之初,这家公司便因创始人光环而备受关注。而长文本,则是月之暗面很早就确立的技术方向——月之暗面(“Moonshot”)公众号的第一篇推文,发布于2023年10月10日,标题就叫《欢迎与 Moonshot AI 共同开启 Loooooooooong LLM 时代》。
回头望去,“长文本”的成功绝不单单是技术创新的胜利,更是一场大模型围绕应用与算力的信仰之战。
3月18日,月之暗面宣布Kimi可支持的无损上下文长度由20万汉字增至200万汉字,并开启“内测”。在此之前,国内大模型所支持的上下文对话窗口最大为10万字量级。
这意味着什么?本质上,Kimi想解决大模型的记忆能力问题:在一场对话中,大模型能够记忆、理解的文本长度越长,用户描述就能更加趋近准确。大模型解决复杂问题、给出优质反馈的可能性也就越高、潜在的应用场景就越广泛。
生物相关专业在读研究生林栩向「市界」表示:3月下旬,他经过同学的推荐开始尝试用Kimi阅读英文文献,后来甚至让Kimi协助自己整理和填充论文提纲等,效果惊人:“粗略估计能节省我50%的时间精力吧”。
而AI从业者Amanda早在去年10月Kimi小范围内测时,就成为了首批种子用户,她对Kimi的走红早有心理预期。她分享道:我愿意在任何场合大肆赞扬Kimi好用且实用。
无数个林栩和Amanda的深度使用和自发传播,让Kimi的系统流量持续高增。
Kimi的长文本背后,也意味着对于技术和算力的强大挑战。
AI研究者洛林向「市界」举了个例子:“如果我想让大模型写个长篇小说,它支持的上下文容量是首先要面临的问题。我要把积累的大量素材、人物框架、故事逻辑等全都输入进去,还要根据想法的完善不断调整输入……创作这整本书的工作,都只能在一个对话窗口里完成,对模型是巨大考验。”
正因于此,杨植麟在接受访问时,不吝将长文本的重要性描绘为“登月第一步”、“新的计算机内存”、“新计算范式的基础”。
而Kimi一经推出便广受欢迎的事实也在印证着他的说法。据Similarweb调研,2024年3月份,Kimi智能助手的月访问量达1218万次,仅次于百度的文心一言,超越了阿里的通义千问,以及字节跳动旗下的豆包。
▲(2024年3月国产大模型月活情况。图源/Similarweb)
而且不论是移动端还是网页端,Kimi都有不俗表现:点点数据显示,2024年1月、2月Kimi移动端与豆包的月活差距不断缩小,并在3月份将豆包甩在了后头。而Similarweb显示,3月Kimi的网页端月活超千万,较2月又实现了3倍增长。
3月22日上午9点半起,Kimi更因过量访问而多次宕机。月之暗面为此紧急采取了种种措施,包括进行了5次系统扩容、设计一套SaaS流量优先级策略。
某种程度上,Kimi的巨大流量涌入不仅超出了月之暗面的预期,更如同一条“鲶鱼”搅动了整个大模型市场,让巨头们也深感危机。
月之暗面宣布Kimi率先开放200万字超长无损上下文能力后的一个星期,百度、360等企业纷纷效仿,甚至开启了一轮上下文能力“比拼赛”。
3月22日,阿里巴巴宣布通义千问达到了1000万字长文本处理规模。同日,百度文心一言也宣布将在4月版本升级时开放200万至500万字的长文本处理能力。3月23日,360表示360智脑正在进行500万字长文本处理功能的内测。
压力之下,据“AI光年”4月10日援引知情人士消息,为区别文心一言大模型在技术、To C产品、To B市场的定位,百度内部高管正讨论,是否需要为文心一言更换新的品牌标识。对此,百度公关人士回应「市界」,其对上述传言的真实性并不了解,不作回应。
02、“长文本”是个碎钞机
以一己之力,Kimi为整个国产大模型市场完成了一次“长文本”的用户教育。这背后既有技术实力领先的因素,雄厚的资本储备与营销投放亦功不可没。
杨植麟在接受《腾讯新闻》采访时表示,从创业的第一天开始,他便奔跑在争分夺秒的“找钱”之中。“我们2023年2月开始集中做第一轮融资。如果delay(延迟)到4月,基本没机会了……在美国有一个晚上,我做了精确的计算。算完觉得至少要在几个月内拿到1亿美元。”
某种程度上,国内大模型的生死角逐,犹如一场激烈的军备竞赛。
据知微数据调研显示,在200万字长文本功能更新之前,月之暗面的企业传播重点更多聚焦于技术愿景传播;在那之后,“种草”投放便成了月之暗面的重中之重。而在抖音、小红书、B站等渠道,围绕“Kimi 智能助手” “Kimi AI”“文案一键搞定”等关键词搜索,都能看到大量Kimi投放的手笔。
基于Kimi主打的文献阅读、财报梳理等“长文本”使用场景,其官方宣传语也强调长文本的总结效果优势,诸如“文件,拖进来;网址,发出来”“别焦虑,Kimi帮你整理资料”“每一次,都集中全力”。
▲(图源/Kimi网页端)
月之暗面敢于撒下大手笔,撬动起巨大的流量盘,无疑需要源源不断的现金流支持。
据新浪科技报道,目前Kimi投放广告的获客单人成本约在10元,如果算上拉新后用户问答互动产生的算力成本,每个用户的获客成本达到12-13元。如果按照第三方平台显示,近一个月来日均下载量为17805次,Kimi每天的获客成本需要至少20万元。
Amanda曾经从事过AI算力相关工作,她对「市界」表示:“早在2023年2月份,我便获知有创业者正在组建团队,需要几千张A100卡(英伟达生产的一款旗舰GPU)。”事后看来,这一指向正是月之暗面。
金钱与算力,是这场权力游戏中必备的资源。为了留在牌桌上,月之暗面不得不加快融资密度。
2023年6月,月之暗面公布了超2亿美元的天使轮融资,投资方包括真格基金、红杉中国。一年后的2024年2月,市场传出消息,月之暗面完成了10亿美元的新融资。除老股东跟投外,新增投资方红杉中国、小红书、美团、阿里等,公司估值达到约25亿美元。随后,该笔融资金额被修正为8亿美元,参股股东也仅剩下了阿里与砺思资本。
据市场消息称,8亿美元中的约7.9亿美元均来自阿里,为此月之暗面出让了40%的股权——也正是阿里的重金入场,抬高了公司估值,让小红书、美团等企业最终没有选择加入投资阵营。
而阿里能“拿下”月之暗面的底气,除了资金,还有阿里云算力作为筹码。前述VC合伙人对「市界」表示,结合2月这轮融资的股权稀释,杨植麟创始团队持股很可能已小于50%。据其了解,阿里实际出资金额不足6亿,其中部分或折算成了云计算算力。
能接受这一看似苛刻的条款,除了月之暗面对于弹药的渴求,背后也离不开关键人士的“撮合”。
上述投资人告诉「市界」,曾成功挖掘出小红书项目的著名投资人、金沙江主管合伙人张予彤是此次交易的关键人物。此前,同为清华校友的张予彤与杨植麟早有渊源,曾投资过他在月之暗面创业前的项目“循环智能”。
将视线拉向更久以前,帮助促成月之暗面的融资,或也可看作朱啸虎对阿里的“投桃报李”。过去十几年间,在朱啸虎投资的饿了么、ofo、滴滴等交易中,市场上屡有传闻,阿里曾数次收购朱啸虎手中老股。
虽然对于月之暗面,朱啸虎的公开态度似乎不够积极。近期在接受访问时,朱啸虎直言:“他(杨植麟)做科研是可以的,但我不知道他怎么商业化。”朱啸虎表示自己更信仰的是“能马上商业化”的AIGC应用。但从最终入局的结果来看,Kimi、阿里与朱啸虎仍旧达成了“三赢”局面。
另据“暗涌Waves”援引月之暗面投资人说法:“月之暗面在谈判中,已经把一些苛刻条款逐一谈掉了”,具体包括“做了AB股处理,使得团队保有绝对的决策权和控制权”等。
03、远景与暗礁
凭借充沛的资金流与算力储备,月之暗面暂时走通了“烧钱换量”的To C拓客模式。而接下来,如何探索付费模式才是决胜的关键。
今年,月之暗面工程副总裁许欣然对媒体表示:Kimi智能助手预计在今年上半年开启付费模式。3月27日下午,一位学者发现Kimi智能助手开始设置使用门槛,需要用户给微信好友,来换取80条/3小时的使用量。
这一逻辑并不难理解,互联网的“规模效应”在大模型市场很难实现。新增用户越多、用户的输入/输出请求越频繁,都要求着更大的算力成本投入。月之暗面也势必要在不计成本地培养用户习惯之后,探寻自我造血。
当下,To B正成为月之暗面的下一个发力方向。3月底,数字人企业、A股上市公司天娱数科旗下的“智境云创”,接入了Kimi大模型。
相关人士告诉「市界」,公司从去年底就已注意到Kimi。由于长文本处理能力出色,Kimi能够更深入地理解和分析大篇幅的内容;其次,Kimi注重沉浸式对话体验,善于扮演虚拟角色,为用户营造身临其境之感;实际体验下来,智境云创发现Kimi的响应速度也相对较快,在公司对比时超越了同类产品。
“这在游戏、娱乐、教育等(数字人经典应用)场景下特别吸引人”,他讲道。
而Kimi的企业API服务也在4月上线,留学行业AI产品创业者小鱼告诉「市界」,Kimi的To B API服务已从4月9日开始公测。而小鱼之所以选择月之暗面,是综合考量了性能、收费等因素:“调试下来,仅有通义和Kimi能满足我们对产品的要求。国产大模型有的英文输出效果远不及预期,我认为Kimi的To B服务平台和通道都已经搭建完成,收费也比OpenAI的GPT-4便宜。”
据「市界」统计,目前在各大国产模型中,讯飞星火大模型、Kimi、腾讯混元的收费排在第一梯队,每1000个token收费分别为0.015元、0.012元、0.01元;通义千问、文心一言每1000个token收费均为0.008元;智谱收费为每1000个token收费0.005元——这也是与OpenAI GPT-3.5最为接近的定价(OpenAI对输入/输出定价有所区别,折算下来价格约等于¥0.004/1000token)。
而GPT-4 API的定价,则为每1000个Token的输入端收费约0.2元(0.03美元),输出端收费约0.4元(0.06美元)。相比之下,在千行百业对优质大模型的渴求背景下,Kimi的定价仍极具竞争力。
▲(各大模型定价情况/受访者供图)
不过,虽然Kimi正在To B、To C两个市场中齐头并进,但快速巩固、修筑自己的技术护城河也同样紧迫。
除了百度、阿里、360等巨头已加速兵临城下,AI研究者洛林向「市界」分享,从技术角度解决大模型的记忆问题,并非“长文本”一种思路。其他解决方案如RAG(检索增强生成),至今还未与长文本有明确的高下之分。
压力之下,月之暗面也在不断扩充自己的团队,招兵买马。
今年3月初,杨植麟曾对媒体透露公司规模为约80人。而据3月末市场流传的一份调研纪要显示,团队规模已扩充到了100-200人——其中技术(算法专家、系统专家、数据工程团队等)人员加起来120人左右,其余为Kimi App产品规划(产品开发团队)、To B商业化团队。
据多位员工告诉「市界」,如今整个公司卯足了劲,“大模型公司需要做的工作非常多,难免996,但我们办公氛围很好。”此外他还透露,杨植麟的工位与研发部普通员工安排在一起,公司文化亦鼓励直接沟通。
同时,「市界」也在多个渠道看到了月之暗面的内推链接,其中产品增长方向的岗位一度投递火热。
在一个月之暗面的内推群中,「市界」观察到群人数在不到一星期内,便快速增长到了近500人。其中不少人都期待获得产品增长的实习机会,甚至由于收到的简历过多,发布相关内推链接的员工为此想出了快速筛选的方式:让投递者分享一条Kimi推广的自来水帖,由其评估质量,如果过关,再转递给HR。
这样的文化,或许正是杨植麟所梦想的,“一个为AGI而搭建的组织”的雏形。但同样如他在访谈中所说:AGI事业如同开车向“绵延而未知的雪山”前进。行至如今,还没有谁能断定,究竟哪种模式,才能真正从市场中杀出来。