人工智能测评初创企业LMArena新一轮融资后估值达17亿美元
文库划重点:访客可以在平台上提出问题,或是调用模型生成图像等内容。用户需要在两个模型输出结果中选出更优的一个,之后平台才会揭晓每个结果对应的模型。

LMArena联合创始人阿纳斯塔西奥斯・安杰洛普洛斯
据LMArena公司透露,这家凭借人工智能模型性能排名体系广受行业认可的初创企业,在新一轮融资中筹集到1.5亿美元资金,投后估值(含本次融资额)达到17亿美元。这一估值较2025年5月披露的种子轮融资估值增长了近两倍。
本轮融资由现有投资方菲利斯资本以及加州大学投资部门联合领投。所筹资金将用于两方面:一是为公司的人工智能模型测评业务购置算力资源 —— 其测评客户涵盖OpenAI、谷歌、xAI、微软等行业巨头;二是招募技术人才。目前,每月有数百万人访问LMArena的网站,通过模型两两对比的方式对其进行评分,这些评分结果将作为模型排名的重要依据。
2025年9月,LMArena的年化营收规模为数百万美元,其最新营收数据暂未对外披露。该公司估算,按照近期客户使用量推算的“年化消费营收额”已于上月突破3000万美元。
这家公司脱胎于近三年前启动的一个开源项目,目前在全球150个国家和地区拥有超500万月活跃用户,不过暂不清楚这一数据是否同时包含网站访客与模型评分参与者。
LMArena的网站向所有互联网用户开放,访客可以在平台上提出问题,或是调用模型生成图像等内容。用户需要在两个模型输出结果中选出更优的一个,之后平台才会揭晓每个结果对应的模型。LMArena会将所有评分结果汇总,形成涵盖人工智能代码生成、图像生成、视频生成等多个类别的模型排行榜。
这家初创企业有时还会在模型正式发布前,提前接入平台供用户测评,帮助模型开发企业获取早期反馈。随着行业内各个人工智能模型的性能差距逐渐缩小,模型开发商开始将自家产品在LMArena上的排名作为对外宣传的重要亮点。
公司首席执行官兼联合创始人阿纳斯塔西奥斯・安杰洛普洛斯表示:“头部人工智能实验室选择与我们合作,是因为他们很难自行判断旗下模型的优劣水平。”
不过,部分模型开发商对LMArena的测评方式提出了质疑。他们认为,依靠无偿互联网用户提供反馈的模式存在缺陷,不仅容易被人为操纵,而且结果也无法反映行业专家的专业意见。与之形成对比的是,LMArena的竞争对手 —— 例如数据标注初创企业Scale AI—— 会聘请律师、教授等专业人士对模型进行评估打分。
针对外界的质疑,LMArena回应称,普通用户在评判与自身相关的问题答案时,往往具备更精准的判断力,而且不向专家支付报酬的模式,能够让平台获取更真实客观的反馈。
公司联合创始人扬・斯托伊卡于2025年末在接受《信息》采访时表示:“能获得的最高质量测评 —— 也就是业内所说的‘黄金标准’,往往来自人们对自己熟悉领域的评价。”
扬・斯托伊卡是美国加州大学伯克利分校的计算机科学教授,同时也是数据中台公司Databricks的联合创始人。他最初与伯克利分校研究生阿纳斯塔西奥斯・安杰洛普洛斯、江伟霖合作,以“聊天机器人竞技场(ChatBot Arena)”为项目名启动了这一测评平台。项目早期资金完全来自各类科研资助与社会捐赠,直至2025年5月才正式转型为营利性企业。
斯托伊卡此前曾透露,LMArena正考虑拓展业务边界,计划利用平台积累的数据,通过强化学习技术训练人工智能模型。强化学习是一种奖惩机制驱动的训练方法,模型完成既定目标会获得奖励,反之则会受到惩罚。虽然人类反馈可以用于模型训练,但随着“推理型”人工智能模型的兴起,行业内越来越倾向于从其他人工智能模型中获取反馈数据。而向强化学习相关服务领域拓展,或将帮助LMArena持续贴合客户的核心需求。
本轮融资联合领投方、菲利斯资本的普通合伙人彼得・邓恩表示:“一旦成为行业公认的测评基准平台,产品的业务边界自然会随之拓展。其核心价值在于与人工智能实验室建立深度合作关系 —— 将实验室的内部数据与平台的外部对比数据相结合。”
除领投方外,安德森・霍洛维茨基金、众议院基金、LDVP资本、凯鹏华盈、光速创投、劳德创投等机构也参与了本轮融资。至此,LMArena的融资总额已突破2.5亿美元。
哈希力量文库收录,手机端省略本文网址
