人工智能测评初创企业LMArena新一轮融资后估值达17亿美元

环球市场播报 ☉ 文来源：新浪财经
2026-01-07 @ 哈希力量

人工摘要：访客可以在平台上提出问题，或是调用模型生成图像等内容。用户需要在两个模型输出结果中选出更优的一个，之后平台才会揭晓每个结果对应的模型。

LMArena联合创始人阿纳斯塔西奥斯・安杰洛普洛斯

据LMArena公司透露，这家凭借人工智能模型性能排名体系广受行业认可的初创企业，在新一轮融资中筹集到1.5亿美元资金，投后估值（含本次融资额）达到17亿美元。这一估值较2025年5月披露的种子轮融资估值增长了近两倍。

本轮融资由现有投资方菲利斯资本以及加州大学投资部门联合领投。所筹资金将用于两方面：一是为公司的人工智能模型测评业务购置算力资源 —— 其测评客户涵盖OpenAI、谷歌、xAI、微软等行业巨头；二是招募技术人才。目前，每月有数百万人访问LMArena的网站，通过模型两两对比的方式对其进行评分，这些评分结果将作为模型排名的重要依据。

2025年9月，LMArena的年化营收规模为数百万美元，其最新营收数据暂未对外披露。该公司估算，按照近期客户使用量推算的“年化消费营收额”已于上月突破3000万美元。

这家公司脱胎于近三年前启动的一个开源项目，目前在全球150个国家和地区拥有超500万月活跃用户，不过暂不清楚这一数据是否同时包含网站访客与模型评分参与者。

LMArena的网站向所有互联网用户开放，访客可以在平台上提出问题，或是调用模型生成图像等内容。用户需要在两个模型输出结果中选出更优的一个，之后平台才会揭晓每个结果对应的模型。LMArena会将所有评分结果汇总，形成涵盖人工智能代码生成、图像生成、视频生成等多个类别的模型排行榜。

这家初创企业有时还会在模型正式发布前，提前接入平台供用户测评，帮助模型开发企业获取早期反馈。随着行业内各个人工智能模型的性能差距逐渐缩小，模型开发商开始将自家产品在LMArena上的排名作为对外宣传的重要亮点。

公司首席执行官兼联合创始人阿纳斯塔西奥斯・安杰洛普洛斯表示：“头部人工智能实验室选择与我们合作，是因为他们很难自行判断旗下模型的优劣水平。”

不过，部分模型开发商对LMArena的测评方式提出了质疑。他们认为，依靠无偿互联网用户提供反馈的模式存在缺陷，不仅容易被人为操纵，而且结果也无法反映行业专家的专业意见。与之形成对比的是，LMArena的竞争对手 —— 例如数据标注初创企业Scale AI—— 会聘请律师、教授等专业人士对模型进行评估打分。

针对外界的质疑，LMArena回应称，普通用户在评判与自身相关的问题答案时，往往具备更精准的判断力，而且不向专家支付报酬的模式，能够让平台获取更真实客观的反馈。

公司联合创始人扬・斯托伊卡于2025年末在接受《信息》采访时表示：“能获得的最高质量测评 —— 也就是业内所说的‘黄金标准’，往往来自人们对自己熟悉领域的评价。”

扬・斯托伊卡是美国加州大学伯克利分校的计算机科学教授，同时也是数据中台公司Databricks的联合创始人。他最初与伯克利分校研究生阿纳斯塔西奥斯・安杰洛普洛斯、江伟霖合作，以“聊天机器人竞技场（ChatBot Arena）”为项目名启动了这一测评平台。项目早期资金完全来自各类科研资助与社会捐赠，直至2025年5月才正式转型为营利性企业。

斯托伊卡此前曾透露，LMArena正考虑拓展业务边界，计划利用平台积累的数据，通过强化学习技术训练人工智能模型。强化学习是一种奖惩机制驱动的训练方法，模型完成既定目标会获得奖励，反之则会受到惩罚。虽然人类反馈可以用于模型训练，但随着“推理型”人工智能模型的兴起，行业内越来越倾向于从其他人工智能模型中获取反馈数据。而向强化学习相关服务领域拓展，或将帮助LMArena持续贴合客户的核心需求。

本轮融资联合领投方、菲利斯资本的普通合伙人彼得・邓恩表示：“一旦成为行业公认的测评基准平台，产品的业务边界自然会随之拓展。其核心价值在于与人工智能实验室建立深度合作关系 —— 将实验室的内部数据与平台的外部对比数据相结合。”

除领投方外，安德森・霍洛维茨基金、众议院基金、LDVP资本、凯鹏华盈、光速创投、劳德创投等机构也参与了本轮融资。至此，LMArena的融资总额已突破2.5亿美元。

哈希力量文库选录，手机端省略本文网址

.长文建议换电脑刷.

【投融资简报库】

面壁智能融资超50亿

Deeplore完成数千万元种子轮

逐际动力完成Pre-IPO轮